انتخاب سبد سرمایه با استفاده از ماشین بردار پشتیبان و خوشه بندی
مسعود رستگارمقدم عیدیان
استاد راهنما:
دکتر امیرعباس نجفی
پایان نامه برای دریافت مدرک کارشناسی ارشد
رشته مهندسی صنایع گرایش مهندسی مالی
شهریور 93
انتخاب سبد سرمایه با استفاده از ماشین بردار پشتیبان و خوشه بندی
مسعود رستگارمقدم عیدیان
استاد راهنما:
دکتر امیرعباس نجفی
پایان نامه برای دریافت مدرک کارشناسی ارشد
رشته مهندسی صنایع گرایش مهندسی مالی
شهریور 93
تقدیم به
مادر عزیزم
تاسيس 1307
دانشگاه صنعتي خواجه نصيرالدين طوسي
تأییدیه هیأت داورانشماره:
تاريخ:هیأت داوران پس از مطالعه پایان‌نامه و شرکت در جلسه دفاع از پایان نامه تهیه شده تحت عنوان : انتخاب سبد سرمایه با استفاده از ماشین بردار پشتیبان و خوشهبندی توسط آقای مسعود رستگارمقدم عیدیان ، صحت و کفایت تحقیق انجام شده را برای اخذ درجه کارشناسی ارشد در رشته مهندسی صنایع گرایش مهندسی مالی در تاريخ ……../6/ 1393 مورد تأیید قرار می‌دهند.1- استاد راهنماجناب آقای دکتر امیرعباس نجفیامضاء2- استاد مشاورجناب آقای / سركار خانم دکتر ……………………………………امضاء3- ممتحن داخلیجناب آقای / سركار خانم دکتر ……………………………………امضاء4- ممتحن خارجیجناب آقای / سركار خانم دکتر ……………………………………امضاء5- معاونت آموزشی و تحصیلات تکمیلی دانشکدهجناب آقای / سركار خانم دکتر ……………………………………امضاء
تاسيس 1307
دانشگاه صنعتي خواجه نصيرالدين طوسياظهارنامه دانشجوشماره:
تاريخ:
اینجانب مسعود رستگارمقدم عیدیان دانشجوی کارشناسی ارشد رشته مهندسی صنایع گرایش مهندسی مالی دانشکده مهندسی صنایع دانشگاه صنعتي خواجه نصیرالدین طوسی گواهی می‌نمایم که تحقیقات ارائه شده در پایان‌نامه با عنوان انتخاب سبد سرمایه با استفاده از ماشین بردار پشتیبان و خوشهبندی با راهنمايي استاد محترم جناب آقاي دكتر امیرعباس نجفی، توسط شخص اینجانب انجام شده و صحت واصالت مطالب نگارش شده در این پایان‌نامه مورد تأیید می‌باشد، و در مورد استفاده از کار دیگر محققان به مرجع مورد استفاده اشاره شده است. بعلاوه گواهی می‌نمایم که مطالب مندرج در پایان نامه تا کنون برای دریافت هیچ نوع مدرک یا امتیازی توسط اینجانب یا فرد دیگری در هیچ جا ارائه نشده است و در تدوین متن پایان‌نامه چارچوب (فرمت) مصوب دانشكده مهندسي صنايع را بطور کامل رعایت کرده‌ام. چنانچه در هر زمان خلاف آنچه گواهي نموده‌ام مشاهده گردد خود را از آثار حقيقي و حقوقي ناشي از دريافت مدرك کارشناسی ارشد محروم مي‌دانم و هيچگونه ادعائي نخواهم داشت.

امضاء دانشجو:
تاریخ:

تاسيس 1307
دانشگاه صنعتي خواجه نصيرالدين طوسيحق طبع و نشر و مالکیت نتایجشماره:
تاريخ:
1- حق چاپ و تکثیر این پایان‌نامه متعلق به نویسنده آن می‌باشد. هرگونه کپی برداری بصورت کل پایان‌نامه یا بخشی از آن تنها با موافقت نویسنده یا کتابخانه دانشکده مهندسی صنایع دانشگاه صنعتی خواجه نصیرالدین طوسی مجاز می‌باشد.
ضمناً متن این صفحه نیز باید در نسخه تکثیر شده وجود داشته باشد.
2- کلیه حقوق معنوی این اثر متعلق به دانشگاه صنعتی خواجه نصیرالدین طوسی می‌باشد و بدون اجازه کتبی دانشگاه به شخص ثالث قابل واگذاری نیست.
همچنین استفاده از اطلاعات و نتایج موجود در پایان نامه بدون ذکر مراجع
مجاز نمی‌باشد.
تشکر و قدردانی فراوان
از زحمات بی دریغ و فراوان جناب آقای دکتر نجفی
و کمک های بی شائبه آقای ندایی

و سپاس فراوان از پروردگارم که همواره پشتیبانم بوده است.
چکیده
انتخاب سبد سرمایه و کسب حداکثری بازده با وجود ریسک کم و نقدشوندگی بالا یکی از تصمیمات پیچیده برای سرمایه گذاران است. با توجه به اینکه پرتفو بهینه از میان سهام های برتر منتخب بوجود میآید،انتخاب سهام و رتبه بندی آنان نگاه ریزبینتری از تحقیقات را شامل میشود که هدف آنان معرفی بهترینها جهت تشکیل سبد سرمایه میباشد. مدل تشکیل سبد سرمایه مدرن(مارکویتز) تنها بر اساس معیارهای بازده و ریسک به انتخاب سهامها میپردازد. هرچند در مطالعات بعد سعی در منظور نمودن معیارها و سنجههای دیگر در مدل مارکویتز جهت بالا بردن عملکرد سبد سرمایه نمودند، ولی توجه کمتری به روند مالی و عملکرد سالانه شرکتهای حاضر در بورس شده است. لذا تشکیل سبد سرمایه بر مبنای تحلیل بنیادی شرکتها و عملکرد مالی آنها مبنای برخی از تحقیقات گردیده است.
با توجه به پیشرفت های صورت گرفته در مدلهای یادگیری و تکینکهای دادهکاوی خط وسیعی از تحقیقات بازار سرمایه که مبتنی بر پیشبینی است به بررسی نحوه استفاده از این مدلها میپردازد. در این پایان نامه با استفاده از ماشین بردار پشتیبان، مدلی را جهت رتبه بندی سهام ها و نیز پیش بینی سهامهای برتر ارائه شده است. در این مدل با استفاده از الگوریتم خوشه بندی K-means دادههای پرت را از مجموعه داده حذف شده و با استفاده از تحلیل پوششی دادهها شرکتهای کارا و ناکارا مشخص شده است. پس از آموزش ماشین بردار پشتیبان، با پیش بینی رتبه سهام ها در سال پایانی و انتخاب سهامهای برتر پرتفو بهینه برای سال بعد ارائه شده است. در نهایت جهت اعتبار سنجی مدل ارائه شده، آن را با میانگین بازده بازار و پرتفوی بهینه بدست آمده از مدل مارکویتز مقایسه شده است.
کلید واژه: پرتفو، ماشین بردار پشتیبان، خوشهبندی، تحلیل بنیادی. تحلیل پوششی داده ها
فهرست مطالب
فصل 1: مقدمه و کلیات تحقیق1
1 -1 مقدمه2
1-2 هدف از پایان نامه3
1-3 توضیح موضوع تحقیق3
1-4 توجیه ، انگیزه و علت انتخاب موضوع4
1-5 اهمیت موضوع5
1-6 مرور کلی بر ادبیات موضوع6
1-7 جنبه های نوآوری موضوع7
1-8 پرسشها و سوالات اصلی تحقیق8
1-9 روش و متدولوژی تحقیق8
1-10 نتایج مورد انتظار9
1-11 کاربرد های تحقیق9
1-12 چارچوب پایان نامه10
1-13 جمع بندی11
فصل دوم: مروری بر تحقیقات پیشین12
2-1 مقدمه13
2-2مروری بر مفاهیم پایه ماشین بردار پشتیبان14
2-2-1ابرصفحه ونیم فضا14
2-2-2نرم بردار 14
2-2-3فاصله نقطه از ابرصفحه14
2-2-4ابرصفحه متعارفی15
2-3انواع ماشین بردار پشتیبان15
2-3-1مدل داده های تفکیک پذیر خطی15
2-3-2مدل داده های تفکیک ناپذیر خطی18
2-4توابع کرنل23
2-5کاربرد ماشین بردار پشتیبان در مدیریت پرتفو26
2-6مدل تحلیل پوششی داده ها27
2-6-1ماهيت الگوي مورد استفاده28
2-6-3انواع الگو هاي DEA29
2-7الگوریتم خوشه بندی K-means36
فصل سوم: روش تحقیق40
3-1 مقدمه41
3-2 طرح کلی از مدل41
3-3 آماده سازی داده ها42
3-3-1 تعیین نسبت های مالی42
3-3-2 ساخت مجموعه داده سهام ها43
3-3-3 کاهش سطری و ستونی43
3-3-4 معیارهای دسته بندی44
3-3-5 تکمیل داده های مفقوده45
3-4 دسته بندی داده ها46
3-4-1 دسته بندی به کمک تکنیکDEA46
3-4-2 دسته بندی بر اساس نظریه مدل قیمت گذاری دارایی سرمایهای (CAPM)47
3-5خوشه بندی داده ها و مشخص نمودن داده های زائد48
3-6حل مدل با استفاده از ماشین بردار پشتیبان49
3-6-1ماشین بردار پشتیبان برای رویکرد مبتنی بر DEA49
3-6-2 ماشین بردار پشتیبان مبتنی بر رویکرد CAPM50
3-7 تشکیل پرتفو51
3-8 اعتبار سنجی مدل51
3-9 جمع بندی52
فصل چهارم: پیاده سازی مدل در بورس اوراق بهادار تهران، نتایج و عملکرد53
4-1 مقدمه54
4-2 داده های مورد استفاده54
4-3 آماده سازی داده ها55
4-4 دسته بندی داده ها56
4-4-1 دسته بندی داده ها بر مبنای رویکرد DEA56
4-4-2 دسته بندی بر مبنای مدل CAPM58
4-5 خوشه بندی داده ها و حذف داده های زائد59
4-5-1 خوشه بندی داده های مبتنی بر رویکرد DEA59
4-5-2 خوشه بندی داده های مبتنی بر رویکرد CAPM61
4-6 دسته بندی به کمک ماشین بردار پشتیبان64
4-6-1 دسته بندی مبتنی بر رویکرد DEA64
4-6-2 دسته بندی مبتنی بر رویکرد CAPM71
4-7 رتبه بندی سهام74
4-8 تشکیل پرتفو75
4-9 اعتبارسنجی مدل79
4-10 جمع بندی80
فصل پنجم: نتیجه گیری و پیشنهاد برای تحقیقات آتی81
5-1مقدمه82
5-2 یافته ها و نتایج تحقیق83
5-3 دستاوردهای تحقیق83
5-4 پیشنهاداتی برای تحقیقات آتی84
فهرست مراجع86
فهرست جداول
جدول 2-1 برخی از مدل های توسعه یافته در حوزه ماشین بردار پشتیبان (به ترتیب سال تحقیق)21
جدول22 برخی از مطالعات صورت گرفته در حوزه مرتبط با توابع کرنل در ماشین بردار پشتیبان( ترتیب سال تحقیق)25
جدول3-1 نسبتهای مالی استفاده شده44
جدول4- 2 نرخ سود سپرده گذاری یکساله58
جدول4- 3 تعداد داده هر دسته در رویکرد DEA60
جدول4- 4 تعداد داده خوشه های دسته(1-،1،1-)60
جدول4- 5 تعداد داده خوشه های دسته(1-،1-،1-)61
جدول4- 6 تعداد داده های دسته های مبتنی بر رویکردCAPM61
جدول4- 7 تعداد داده های خوشه های دسته(1،1)62
جدول4- 8 تعداد داده خوشه های دسته(1،1-)62
جدول4- 9 تعداد داده خوشه های دسته(1،1-)63
جدول4- 10 تعداد داده های خوشه های دسته (1-،1-)63
جدول4- 11 نتایج حاصل از اجرای مدل برحسب بازده65
جدول4- 12 نتایج حاصل از دسته بندی بر حسب ریسک برای کلاس 1 بازده66
جدول4- 13 نتایج دسته بندی برحسب ریسک برای کلاس1- بازده66
جدول4- 14 نتایج حاصل از دسته بندی بر حسب نقدشوندگی برای دسته(1،1)67
جدول4- 15نتایج دسته بندی بر حسب نقدشوندگی برای دسته(1،1-)68
جدول4- 16نتایج دسته بندی برحسب نقدشوندگی برای دسته(1-،1)69
جدول4- 17نتایج دسته بندی برحسب نقدشوندگی برای دسته(1-،1-)69
جدول4- 18عملکرد مدل برای هر دسته مبتنی بر رویکرد DEA71
جدول4- 19 نتایج دسته بندی برحسب بازده انتظاری72
جدول4- 20نتایج دسته بندی برحسب نقدشوندگی برای کلاس 1 بازده انتظاری72
جدول4- 21 نتایج دسته بندی بر حسب نقدشوندگی برای کلاس1- بازده انتظاری73
جدول4- 22عملکرد مدل در هر دسته در رویکرد CAPM74
جدول4- 23 نتایج پرتفو برترین ها CAPM76
جدول4- 24 نتایج پرتفو حاصل از 25% برتر سهام ها مبتنی بر رویکرد CAPM76
جدول4- 25 نتایج پرتفو حاصل از برترین های مبتنی بر DEA77
جدول4- 26 نتایج پرتفو حاصل از 25% برتر مبتنی بر DEA77
جدول4- 27 سهام ها حاضر در پرتفو بهینه ارائه شده78
جدول4- 28 نتایج حاصل از پرتفوی کل بازار79
جدول4- 29 نتایج حاصل از تشکیل پرتفو به روش مارکویتز80
فهرست شکل ها
شكل 2-1 تفكيك داده ها در حالت تفكيك پذير خطي16
شکل 2-2 تفکیک داده ها در حالت تفکیک ناپذیر خطی18
شکل 2-3 ماشین بردار پشتیبان غیر خطی23
شکل3- 1 طرح کلی مدل42
شکل3-2 مدل مفهومی ماشین بردار پشتیبان سلسله مراتبی50
جدول4- 1 انواع ورودی و خروجی های استفاده شده در ادبیات موضوع57
شکل4- 1 مقدار تابع- تکرار دسته بندی برحسب بازده65
شکل4- 2 مقدار تابع-تکرار دسته بندی کلاس1 بازده برحسب ریسک66
شکل4- 3 مقدارتابع-تکرار برای دسته بندی بر حسب ریسک کلاس1- بازده67
شکل4- 4 مقدارتابع-تکرار دسته بندی بر حسب نقدشوندگی برای دسته(1،1)68
شکل4- 5مقدارتابع-تکرار دسته بندی برحسب نقدشوندگی برای دسته(1،1-)68
شکل4- 6 مقدارتابع-تکرار دسته بندی برحسب نقدشوندگی برای دسته(1-،1)69
شکل4- 7 مقدار تابع-تکرار دسته بندی بر حسب نقدشوندگی برای دسته(1-،1-)70
شکل4- 8 مقدارتابع-تکرار دسته بندی بر حسب بازده انتظاری72
شکل4- 9مقدار تابع-تکرار برحسب نقدشوندگی برای کلاس 1 بازده انتظاری73
شکل4- 10 مقدار تابع-تکرار بر حسب نقدشوندگی برای کلاس1- بازده انتظاری73
فصل 1: مقدمه و کلیات تحقیق

1 -1 مقدمه
در زمینه تحقیقات سرمایه گذاری در بازار سهام و تشکیل پرتفو مدلهای کمی امکان پذیری وجود دارد. که شامل روشهای پدید آمده از محاسبات نرم افزاری برای پیش بینی سری زمانی مالی و بهینه سازی چند هدفه نرخ بازگشت سرمایه و کاهش ریسک میباشد. علاوه بر این انتخاب ابزارهای مالی برای مدیریت پرتفو مبتنی بر رتبه بندی داراییها با استفاده از انواع مختلف دادههای ورودی و دادههای تاریخی نیز جزیی از روشهای استفاده شده است. از میان همه اینها انتخاب سهام مدت طولانی است که به عنوان یک کار چالش برانگیز و مهم شناخته شده است. این خط از تحقیق بسیار مشروط بر رتبه بندی سهام مطمئن برای ساختن پرتفو است. پیشرفتهای اخیر در یادگیری ماشین و داده کاوی منجر به وجود آمدن فرصتهای قابل توجهی برای حل این مشکلات به صورت موثرتری گردیده است. در این پایان نامه مدلی ارائه شده است که با استفاده از ماشین بردار پشتیبان1 و خوشه بندی2و تحلیل پوششی داده ها3 ضمن پیش بینی، سهامهای برتر را در قالب پرتفو انتخاب مینماید.
1-2 هدف از پایان نامه
هدف از این پایان نامه ارائه مدلی جهت تشکیل سبد سرمایه با توجه به تحلیل بنیادی و استفاده از عملکرد مالی آنها است. توضیح بیشتر آنکه با استفاده از نسبتهای بدست آمده از صورت گزارشهای مالی و نیز تکنیک ماشین بردار پشتیبان و خوشهبندی که در حوزه دادهکاوی قرار می گیرند، ابتدا به آموزش سیستم یادگیری روی آورده شده است و سپس با پیشبینی سهامهای برتر سبد سرمایه را تشکیل داده شده است. ارائه این مدل کمک شایان توجهی به سرمایهگذاران در بازار سرمایه می نماید. زیرا آنان همواره به دنبال مدلی هستند که ضمن در نظر گرفتن اهداف و ارجحیتهای آنان به میل ذاتی آنان در جهت اقدام فعال و زودهنگام در مقابل اقدامات منفعلانه پاسخگو باشد.
این جمله که “تاریخ تکرار میشود.” و نیز تکیه بسیاری از تحقیقات در زمینه پیشبینی بر دادههای تاریخی، گواه این امر است که استفاده از مجموعه دادههای تاریخی امری متداول و ارزشمند برای اقدامات فعالانه است. خصوصا با توجه به اینکه مبنای تحلیل بنیادی بر استفاده از دادههای معنادار صورتهای مالی است.
در مجموع اینکه در این پایان نامه به پاسخگویی در جهت رتبه بندی سهامهای بازار سرمایه و پیش بینی رتبهی سهامهای موجود بر اساس روند مالی سال اخیر و نیز سهامهای تازه وارد به بازار سرمایه پرداخته شده است. و در نهایت پرتفوی بهینه از دل این سهامهای منتخب تشکیل شده است.
1-3 توضیح موضوع تحقیق
همواره یکی از چالشهای بحث برانگیز سهامداران و سرمایهگذاران بازار سرمایه کسب حداکثری سود است. از طرفی باتوجه به گستردگی و تنوع و پیچدگی معاملات این خواسته با اهداف دیگری در تعارض است، که گاه موجب میشود کسب سود بیشتر در تعارض با اهدافی مثل ریسک بیشتر یا نقدشوندگی پایینتر در حاشیه قرار گیرد. در واقع این جایگاه سرمایه گذار و ارجحیت ذهنی آن است که دستیابی به سود حداکثری را تعیین میکند. در جهت رفع نیاز و برآورد کردن خواسته های سرمایه گذاران برخی مستقیما به دنبال تشکیل پرتفوهای چندهدفه برای متنوع سازی و در نظرگیری ترجیحات سرمایهگذاران برآمدهاند. اما خطی از تحقیقات با نگاه ریزبینانهتر به انتخاب سهام پرداختهاند. و توجیه آنها این است که پرتفوی بهینه از سهامهای منتخب برتر تشکیل مییابد. علاوه بر این مزیت انتخاب سهام در این است که میتوان از سهامهای برتر برای جایگرینی سهام در بازبینی پرتفو4 استفاده نمود.
در این پایان نامه با در نظرگیری ترجیحات سرمایه گذاران در قالب تکنیک دسته بندی ماشین بردار پشتیبان به پیشبینی رتبهی سهامهای بورس اوراق بهادار تهران پرداخته شده است. سپس از میان این سهامها پرتفو بهینه تشکیل شده است. علاوه بر این با توجه به اینکه از یکی از تکنیکهای یادگیری ماشین استفاده شده است میتوان به سرمایه گذاران راهکاری در جهت نحوه اقدام در برابر سهامهای تازه راه یافته به بازار داده شود. این پیش بینی بر مبنای تحلیل بنیادی و نسبتهای مالی شرکتهاست.
1-4 توجیه ، انگیزه و علت انتخاب موضوع
با توجه به اینکه در سالهای اخیر رشد و رونق اقتصادی در صدر برنامههای توسعه اقتصادی کشور قرار گرفته است. و یکی از مهمترین برنامهها استفاده از سرمایههای غیرمولد در جهت راه اندازی تولید است. نگاه به بازار سرمایه با توجه به اینکه مناسبترین ابزار در جهت تامین مالی بنگاههای اقتصادی است بسیار ویژه شده است. خصوصا آنکه با استفاده از فضای رسانهای فرهنگ اینکه بجای سپردهگذاری در بانک مردم پولهای خود را روانه بازار سرمایه نمایند در بین بسیاری از مردم جاافتاده است. سوددهی بسیار بالای بورس اوراق بهادار تهران در سال گذشته این موضوع را بیشتر مورد توجه قرار داده است. از طرفی پیچیدگیهای موجود در بازار سرمایه موجب شده است این متقاضیان جدیدالورورد نیاز به استفاده از مدلهایی داشته باشند که ترجیحات آنان را درنظر بگیرد. ترجیحاتی مانند نقدشوندگی بالای سهامهایی که خریداری می شوند. علاوه بر این خط تحقیقی تشکیل سبد سرمایه در تمام دنیا به دلیل جذابیت این بازار مالی همواره پرتحرک بوده است و مخاطبین زیادی را به خود مشغول داشته است. همین موارد سبب گشته که ما به سمت تشکیل سبد سرمایه بهینه برویم و رویکردی را در این راه به خدمت بگیریم، که علاوه بر تشکیل سبد سرمایه به سرمایه گذاران قدرت مانور بیشتر در بازار در برابر سهامهای تازه وارد شده به بورس بدهیم. البته باید توجه به این کرد که ما از دادههای صورتهای مالی استفاده کردهایم، و میدانیم که درتحلیل بنیادی نگاه سرمایه گذاران بلند مدت است. لذا پیشبینی نیز بلندمدت است. این موضوع را نمیتوان تهدید دانست زیرا در ادبیات بازار سرمایه معمولا نگاه بلندمدت به بازار دارند و نمود آن را میتوان در بازبینیهای متداول دورهای سبد سرمایه برای سرمایه گذاران خرد دید. و همچنین این مدل قابلیت آن را داراست که بجای استفاده از دادههای صورتهای مالی با استفاده از تحلیل تکنیکال و اندیکاتورهای آن حتی به پیش بینی روزانه و رتبه بندی سهامها بپردازیم. اما همانطور که گفته شد ما بر مبنای تحلیل بنیادی جلو رفتهایم و دید بلند مدت داریم. که سبب کاهش هزینههای معاملاتی میشود.
1-5 اهمیت موضوع
انتخاب سهام و رتبهبندی آن زمینه بسیاری از تحقیقات موجود در بازار سرمایه میباشد. این موضوع در کنار رونق بازار سرمایه و ورود سرمایه گذارانی که تجربه کافی در بازار را دارا نیستد،. سبب شده است که در زمینهی رتبهبندی سهامها با توجه به معیارهای سهامداران اقدامات بیشتری صورت پذیرد. لذا به ارائه راهکاری جهت رتبه بندی سهام و در نهایت تشکیل سبد سرمایه پرداخته شده است. در واقع با استفاده از تکنیکهای کمی و ریاضی سهامها را برای سرمایهگذاران رتبهبندی شده است. همچنین تشکیل سبد سرمایه بر مبنای تحلیل بنیادی به گونهای که دید مناسبی به سرمایهگذاران دهد بسیار پر اهمیت است.
1-6 مرور کلی بر ادبیات موضوع
انتخاب سبد داراییها شامل بدست آوردن نسبتهای بهینه از داراییها برای ساختن یک پرتفو به گونهای که به ترتیب اولویت سرمایهگذاری باشد. به عنوان یک زمینه مطالعاتی توسط مدل مارکویتز5 (1952) شروع شد که در آن بازده به عنوان میانگین و ریسک به عنوان واریانس کمی گردیده شدند.
کونو و یامازاکی6 (1991) از قدر مطلق انحراف معیار و اسپرانزا 7(1993) از نیم انحراف معیار برای اندازهگیری ریسک در انتخاب پرتفو استفاده کردند. در این مطالعه در انتخاب پرتفو بازده و ریسک به عنوان دو فاکتور اساسی که انتخاب سرمایهگذاری را حاکم می کنند در نظر گرفته شده اند. به هر حال اغلب فهمیده می شود که همه اطلاعات مرتبط برای انتخاب پرتفو نمیتواند در دو اصطلاح ریسک و بازده فقط تسخیر گردد. معیارهای دیگر اگر بیشتر و مهمتر برای سرمایه گذاران نباشند برابر هستند. با در نظر گرفتن این ها در مدل انتخاب پرتفو، ممکن است برای بدست آوردن پرتفویی که در آن از یک کسری حساب از معیارهای بازده و ریسک است به وسیلهی معیار دیگری عملکرد پرتفو بیشتر جبران شود. که در نتیجه رضایت کلی بیشتری برای سرمایهگذاران ایجاد می شود. بنابراین مدلهای انتخاب پرتفو چند معیاره، علاقه زیادی از محققان در گذشته را دریافت کردهاند. مدل هایی که به وسیله آرناز و همکاران8 (2001)، ارگوت و همکاران9 (2004)، فنگ و همکاران10 (2006) و گوپتا و همکاران11 (2010) مطالعه شدهاند. همچنین میتوان به استفاده از مدلهای بهینهسازی در تصمیمگیریهای مالی مراجعه نمود. در بازارهای سرمایهگذاری مالی،چندین دارایی متفاوت از جمله سهامها، اوراق قرضه،ارزهای خارجی، اختیارات، املاک و مستغلات و قراردادهای آتی برای معامله کردن در دسترس هستند. باید توجه نمود که دارایی های مختلف ممکن است ویژگی های متمایزی با هم در برابر معیارهای مالی بدهند.از آنجا که همه دارایی های مناسب با هریک از سرمایهگذارهای داده شده در بازار نخواهد بود، مطلوب است که این دارایی ها را در کلاسهای متفاوتی بر اساس چند ویژگی از پیش تعریف شده طبقهبندی کنیم.(گوپتا و همکاران،2011) علاوه بر این، بر اساس اولویتهای سرمایهگذاری نیاز به انتخاب چند دارایی با کیفیت خوب از کلاسهای داده شده برای ساخت یک پرتفو بهینه می باشد. در سناریوی دنیای واقعی، مشاوران مالی و شرکتهای سرمایهگذاری با استفاده از تکنیک های مختلف به سرمایه گذاران مشخصات را می دهند و سپس یک مجموعه مناسب از داراییهایی که از آن پرتفوی بهینه ساخته میشود را توصیه میکنند.
یک مشخصه مهم که SVM را یک ابزار امیدوار کننده میسازد برای اجرای مینیمم نمودن ساختار ریسک که با هدف به حداقل رساندن یک محدوده در خطای تعمیم نسبت به خطای تجربی است. و آن تلاشی است برای ساخت یک ابرصفحه جدا کننده بهینه با تبدیل تابع هدف غیر خطی به یک فضای ویژگی با ابعاد بالا و در نتیجه عملکرد تعمیم خوبی در طیف گستردهای از مسالهها را دارد. ازجمله کارهای صورت گرفته در انتخاب سهام با استفاده از SVM به مدل فن و پالانیسوامی12 (2011) در بورس استرالیا، مدل گوپتا و همکاران(2011) در بورس بمبئی هند و مدل هوانگ13(2011) در بورس اوراق بهادار تایوان اشاره نمود.
1-7 جنبه های نوآوری موضوع
در مدل های پیشین تشکیل سبد سرمایه تنها به معیارهایی همچون بازده و ریسک توجه میشده است. در مدل ارائه شده بر مبنای تحلیل بنیادی به تشکیل سبد سرمایه پرداختیم. یعنی علاوه برتوجه به معیارهایی مانند بازده، ریسک و نقدشوندگی عملکرد مالی شرکتها در طی سالیان گذشته نیز جهت بهینهسازی سبد سرمایه استفاده شده است. این مدل با استفاده از ماشین بردار پشتیبان منطق ریاضی آن را مدنظر قرار داده است و فاصله نقاط در فضا با ابرصفحهی این دستهبند را جهت رتبه بندی سهامها استفاده کردهایم. همچنین در این پایان نامه مشخصه سال را که فاصلهی اقلیدسی از آن معنادار است به جهت نقش دادن تغییرات فصلی به مشخصههای بررسی شده تاکنون اضافه نمودهایم.
1-8 پرسشها و سوالات اصلی تحقیق
پرسشها و سوالات اصلی تحقیق را میتوانیم در موارد زیر خلاصه نمائیم:
چگونه یک سبد سرمایه بهینه بر مبنای تحلیل بنیادی تشکیل دهیم؟
چگونه بر اساس صورتهای مالی یک شرکت عملکرد سهام را پیش بینی کنیم؟
چگونه به دستهبندی کمی سهامها با توجه به معیارهای سهامداران بپردازیم؟
چگونه کیفیت دادههای استفاده شده را بالا ببریم؟(حذف مشاهدات زائد)
عملکرد رتبهبندی بین روش DEA و مدل CAPM چگونه است؟
آیا پرتفوی تشکیل شده از این روش دارای عملکرد بهتری نسبت به مدل ریاضی چندهدفه ومیانگین بازده بازار است؟
1-9 روش و متدولوژی تحقیق
در این تحقیق با استفاده از نسبتهای مالی بدست آمده از صورتهای مالی مجموعه داده آموزشی شکل گرفته است. سپس با استفاده از مقادیر بدست آمده از بازده، ریسک، نقدشوندگی و بازده انتظاری برای هر سهم که نحوه محاسبهی آن به تفصیل در فصل سوم آمده است و تکنیک تحلیل پوششی دادهها به دستهبندی سهامها پرداخته شده است. با این معیار که واحدهای کارا در دسته خوب و واحدهای ناکارا در دسته بد جای میگیرند. پس از آن جهت حذف مشاهدات زائد از تکنیک خوشهبندی K-means استفاده شده است. و از بین خوشههای هر دسته، خوشهای که دارای حجم حداکثری دادهها بوده است انتخاب شده است. بدین ترتیب دادههای زائد حذف شده سپس مدل توسط ماشین بردار پشتیبان حل شده است. پس از این مرحله دادههای دستهبندی نشده را جهت پیشبینی دسته وارد ماشین بردار پشتیبان میشود. با تعیین مشخصات ابرصفحهها فاصله اقلیدسی این دادهها از ابرصفحهها اندازه گرفته شده است. و نهایتا بر اساس این فاصلهها سهامهای دستهبندی شده رتبهبندی شده است. و در آخر با تشکیل سبد سرمایههای مبتنی بر رویکرد ارائه شده پرتفوی با بهترین عملکرد را به عنوان پرتفوی انتخاب شده برای سال بعد معرفی گردیده است.
1-10 نتایج مورد انتظار
از نتایج مورد انتظار موارد زیر را میتوان نام برد:
سبد سرمایه تشکیل شده از این روش دارای عملکرد بهتری نسبت به میانگین بازار داشته باشد.
عملکرد رویکرد مبتنی بر DEA بهتر از مدل CAPM است.
پرتفو تشکیل شده از میان 25% برتر بازده بالاتری نسبت به دسته بهترینها داشته باشد.
سبد سرمایه تشکیل شده از این متد عملکرد بهتری نسبت به پرتفو تشکیل شده از مدل ریاضی چندهدفه داشته باشد.
1-11 کاربرد های تحقیق
این تحقیق زمینه بسیار مناسبی پیش روی فعالیت فعالان اقتصادی باز میکند. بازار سهام مملو از اطلاعاتی است که سهمها در اختیار معاملهکنندگان قرار میدهند. بهرهگیری از این اطلاعات مستلزم داشتن دانش مفید در جهت استفاده از آنان میباشد. این تحقیق ارزش ویژهای برای این امر قائل شده است. چرا اینکه با بهرهگیری از تکنیک یادگیرنده ودستهبندی کننده ماشین بردار پشتیبان سعی در استفاده مناسب از دادههای موجود و تحلیل بنیادی جهت تشکیل پرتفو بهینهای برآمده است. همچنین این حوزه تحقیقاتی به دلیل اینکه تازه در ادبیات بهینهسازی پرتفو وارد شده است زمینه بسیار مناسبی برای محققین بازارهای مالی در جهت رشد استفاده از تکنیکهای یادگیری ماشین داراست.
1-12 چارچوب پایان نامه
چارچوب کلی فصل های پایان نامه بدین صورت می باشد که ابتدا در فصل دوم به معرفی ماشین بردار پشتیبان، انواع آن، کارهای انجام گرفته در توسعه آن پرداخته شده است. همچنین با توجه به استفاده از تکنیکهای خوشه بندی و تحلیل پوششی دادهها معرفی کوتاهی روی آنان شده است. مرور بر پیشینه تحقیقاتی دادههای بنیادی استفاده شده جهت پیش بینی در تحقیقات مربوط به بازار سرمایه نیز در این فصل آمده است. در فصل سوم به تفصیل مدل ارائه شده و کارهای انجام شده در روند حل مدل توضیح داده شده است. در فصل چهارم توضیحی روی دادههای استفاده شده از بورس اوراق بهادار تهران و نتایج به دست آمده از اجرای این مدل روی این سهامها پرداختهایم. همچنین در این فصل ارزیابی نتایج بدست آمده از این مدل با مدل چندهدفه و متوسط بازده بازار بررسی شده است. در فصل پنجم نیز چکیده ای از فصول قبل، نتیجهگیری و پیشنهاداتی برای تحقیات آینده در این زمینه ارائه شده است.
1-13 جمع بندی
امروزه انتخاب سبد سرمایه و یا بهینهسازی آن یکی از چالش برانگیزترین بحثهای پیش رو در بازار سرمایه است. همواره سرمایهگذاران به دنبال یافتن مدلی هستند که بتوانند در آن ترجیحات سرمایهگذاری مناسب با خویش را ببینند. ولی به دلیل پیچیدگی بازار معیار اندازه شده مشخصی برای همه آنها ندارند.(مانند ریسک) در این پایان نامه مدلی ارائه شده است که ضمن در نظرگیری ترجیحات سرمایهگذاران آنان را نیز از این قید معیار مشخص کننده برهاند. در این راه با رتبهبندی سهامها کمک شایان توجهی به آنان در بازار سرمایه شده است. همچنین این مدل به آنان قابلیت تصمیمگیری در برابر گزینههای جدید در بازار را میدهد. در فصل آینده به مرور ادبیات و پیشینهی تحقیقاتی روشهای استفاده شده در مدل پرداخته شده است.

فصل دوم: مروری بر تحقیقات پیشین
2-1 مقدمه
در این فصل ضمن معرفی انواع ماشین بردار پشتیبان مروری بر کارهای انجام شده در این حوزه نیز شده است. همچنین با توجه به کاربرد توابع کرنل در دستهبندی کننده ماشین بردار پشتیبان مروری نیز بر کارهای انجام شده در این حوزه داریم. از آنجا که از تکینیک تحلیل پوششی دادهها جهت مشخص کردن برچسب دستهها و نیز الگوریتم K-means جهت مشخص کردن دادههای غیر مرتبط استفاده شده است معرفی اجمالی نیز از این دو تکنیک شده است. یکی از بخشهای مهم این تحقیق رسیدن به نسبتهای مالی مناسبی است که اطلاعات آن برای آموزش ماشین مفید باشد. لذا پیشینهی کارهای انجام گرفته در این حوزه نیز بررسی شده است.
مروری بر مفاهیم پایه ماشین بردار پشتیبان
ابرصفحه ونیم فضا
هر ابرصفحه1 در محور مختصات دکارتی به صورت رابطه 2-1 تعریف می شود:
H:ω^T x+b=0 (2-1)
که در آن بردار نرمال2 صفحه و مقدار اریبی3 (در حالت دو بعدی عرض از مبدا) صفحه می باشند.
هر صفحه، فضای خود را به دو نیم فضای مثبت و منفی تقسیم می کند. نیم فضای مثبت را با و نیم فضای منفی را با نشان می دهند. برای نیم فضاها داریم:
(2-2) {█(ω^T x_i+b>0 ∀x_i∈H^+@ω^T x_i+b<0 ∀x_i∈H^- )┤
نرم بردار
نرم اُم بردار را با نماد نشان داده و به صورت رابطه 2-3 تعریف می کنند:
(2-3) ‖ϕ‖_n=√(n&φ_1^n+φ_2^n+…+φ_m^n )
نرم دوم هر بردار را می توان با نماد (بدون اندیس) نشان داد. نرم دوم بردار در واقع همان اندازه بردار می باشد.
فاصله نقطه از ابرصفحه
فاصله متعامد هر نقطه از ابر صفحه عبارتست از اندازه طولی بردار نرمال ابرصفحه تا نقطه مذکور. این فاصله از رابطه 2-4 محاسبه می شود:
(2-4) d(x_i،H)=(ω^T+b)/‖ω‖
ابرصفحه متعارفی
ابر صفحه و نقاط را در فضای بُعدی در نظر بگیرید. در اینصورت، ابر صفحه را متعارفی4 گویند اگر و تنها اگر:
(2-5) min┬(i=1،2،…،n)⁡〖|ω^T X_i+b|=1〗
انواع ماشین بردار پشتیبان
ماشين بردار پشتيبان يكي از تكنيك هاي دسته بندي است كه بر اساس تئوري يادگيري آماري پايه گذاري و معرفي شده است (وپنيك5، 1998). ماشين بردار پشتيبان به دنبال يافتن ابرصفحهاي است كه با استفاده از آن دادهها را دسته بندي كند. اين ابرصفحه به گونهاي يافته ميشود كه حاشيه دسته بندي را حداكثر نمايد(ندائی،1391). در حالت اصلي، مدل ماشين بردار پشتيبان براي حالت دو دستهاي توسعه داده شد ولي در ادامه رويكردهايي براي حل مدل ماشين بردارپشتيبان در حالت چند دسته اي نيز ارائه گرديد. در ادامه به بررسي مدل ماشين بردار پشتيبان در دو حالت تفكيك پذير خطي6 و غير تفكيك پذير خطي7 پرداخته خواهد شد.
مدل داده های تفکیک پذیر خطی
در اين حالت، هدف از مدل ماشين بردار پشتيبان يافتن يك ابرصفحه متعارفی است به طوريكه اين ابرصفحه داراي بيشترين فاصله از نزديكترين داده هاي هر كدام از دسته ها باشد. اگر بتوان داده ها را با استفاده از يك ابرصفحه به طور كامل از هم تفكيك نمود در اينصورت به آن ها تفكيك پذير خطي گفته مي شود. شكل 2-1 این موضوع را به خوبی نشان میدهد. به نقاطي كه داراي كمترين فاصله از ابرصفحه مذكور مي باشند، بردارهاي پشتيبان گفته مي شود.
شكل 2-1 تفكيك داده ها در حالت تفكيك پذير خطي
بنابراين مدل كلي براي يافتن ابرصفحه اي مطابق با شكل فوق را مي توان به صورت رابطه 2-6 نوشت:
(2-6) maxmin┬(i=1،…،n)⁡〖d(X_i،H)〗
و محدوديت هاي مسئله بايد به گونه اي باشند كه داده هاي دسته يك در نيم فضاي مثبت و داده هاي دسته دوم در نيم فضاي منفي قرار بگيرند. به عبارت ديگر مي توان محدوديت هاي مسئله را از رابطه 2-7 بدست آورد:
(2-7) {█(ω^T X_i+b≥0 ∀X_i∈class 1@ω^T X_i+b≤0 ∀X_i∈class 2)┤
از آنجايي كه ابرصفحه دسته بند در ماشين بردار پشتيبان متعارفی است. فاصله هر كدام از بردارهاي پشتيبان تا ابر صفحه متعارفی طبق رابطه 2-4 و 2-5 برابر عبارت 2-8 است:
(2-8) (ω^T X_i+b)/‖ω‖ =1/‖ω‖ ∀ support vector ∈class 1
(ω^T X_i+b)/‖ω‖ =(-1)/‖ω‖ ∀ support vector∈class 2
بنابراين حاشيه دسته بندي از رابطه 2-9 محاسبه مي شود:
(2-9) 1/‖ω‖ -1/‖ω‖ =2/‖ω‖
تابع هدف ماشين بردار پشتيبان به فرم رابطه 2-9 به صورت ماكزيمم سازي حاشيه تشكيل مي گردد. همچنین از آنجایی که ابرصفحه موجود در ماشین بردار پشتیبان به صورت متعارفی می باشد، محدوديت هاي مسئله با تعريف متغيري به نام مطابق رابطه 2-10 قابل بازنويسي خواهد بود:
(2-10) y_i (ω^T X_i+b)≥1
که در آن برای متغیر داریم:
(2-11) {█(y_i=1 ∀x_i∈class 1@y_i=-1 ∀x_i∈class 2)┤
بنابراین، مدل نهایی ماشین بردار پشتیبان در حالت تفکیک پذیر خطی به صورت رابطه 2-12 خواهد بود.
(2-12) min⁡〖 1/2 ‖ω‖^2 〗¦(y_i (ω^T X_i+b)≥1 i=1،2،…،n)
که در آن ω و b آزاد در علامت اند.
مدل2-12 يك مدل برنامه ريزي رياضي محدب درجه دو است. براي حل چنين مدلي، الگوريتم هاي بسيار زيادي توسعه يافته اند. برخي از روش هاي حل اين دسته از مسائل توسط فلچر8 (1988)، مانگاساريان9(1994) و بازارا و همكاران 10(1992) بررسي شده اند كه از ميان آن ها مي توان از روش لاگرانژين و يا شرط بهينگي كاروش كوهن- تاكر استفاده نمود. تابع لاگرانژين مسئله مذكور به صورت رابطه 2-13 خواهد بود:
(2-13) L_p (ω،b،α)=1/2 ‖ω‖^2-∑_(i=1)^n▒〖α_i [y_i (ω^T X_i+b)-1]〗
با گرفتن مشتق نسبت به متغيرهاي تصميم خواهيم داشت:
(2-14) ((∂L_p)/∂ω=0→ ω=∑_(i=1)^n▒〖α_i y_i x_(i ) 〗)¦((∂L_p)/∂b=0→ 0=∑_(i=1)^n▒〖α_i y_(i (α_i≥0)) 〗)
با استفاده از روابط فوق مي توان مقدار را محاسبه نمود. اما براي محاسبه از رويكرد ديگري استفاده مي نماييم. همانطور كه ذكر شده براي نقاط بردار پشتيبان داريم:
(2-15) y_i (ω^T X_i+b)=1
بنابراين مي توان نوشت:
(2-16) {█(y_i∈+1→min(ω^T X_i+b)=1→b=1-min⁡(ω^T X_i ) @y_i∈-1→min⁡(ω^T X_i+b)=-1→b=-1-max⁡(ω^T X_i))┤
با جمع دو رابطه فوق مي توان نتيجه گرفت:
(2-17) b=1/2(min┬(y_i∈+1)⁡〖〖(ω〗^T X_i)+max┬(y_i∈-1)⁡〖(ω^T X_i))〗 〗
البته از آنجایی که در حل مسئله با ابعاد بالا، الگوریتم های معمول سرعت کافی ندارند، به عنوان روشی توسعه یافته می توان مسئله برنامه ریزی محدب درجه دو را با استفاده از مسئله برنامه ریز خطی تخمین زد. برای مدل ماشین بردار پشتیبان این کار توسط برخی پژوهشگران صورت پذیرفته است (یاجیما11، 2005).
مدل داده های تفکیک ناپذیر خطی
اگر داده ها را نتوان با یک ابرصفحه به طور کامل جداسازی نمود، در این صورت برخی از محدودیت های مدل 2-12 نشدنی می گردند. به عبارت دیگر مدل 2-12 دارای حل شدنی نخواهد بود.
شکل 2-2 تفکیک داده ها در حالت تفکیک ناپذیر خطی
بنابراین با استفاده از یک متغیر تصمیم جدید (از جنس متغیر مصنوعی) مسئله را شدنی می کنیم. این متغیرهای تعریف شده، حتی الامکان باید برابر صفر باشند. بنابراین در تابع هدف نیز آن ها را به فرم حداقل سازی به مسئله اضافه می کنیم. با این کار مسئله دارای دو تابع هدف خواهد بود:
(2-18)



قیمت: تومان

دسته بندی : پایان نامه ارشد

پاسخ دهید