رنل متوالی نگاشت داده ها انجام می شود. همین مسئله باعث بوجود آمدن توابع کرنل جدیدتری گردیده است که عملکرد بهتری را به نسبت توابع قبلی ایجاد می کند. از آن جمله تابع کرنل جدیدی توسط ژانگ و وانگ39 (2011) بر اساس تابع آماری لورنتزیان40 ارائه شده است.
نکته قابل اهمیت دیگر در توابع کرنل انتخاب پارامترهای تابع می باشد. پارامترهای توابع در نگاشت غیر خطی داده ها اثرگذار بوده و بنابراین می توانند دقت دسته بندی را تغییر دهند. در واقع تغییر در پارامتر تابع کرنل فاصله داده ها را در فضای جدید تغییر می دهد. از این رو برخی از پژوهشگران انتخاب پارامتر را برای توابع کرنل مورد بررسی قرار داده اند. در این راستا می توان به تحقیقات وو و وانگ41 (2009) اشاره نمود. جدول 2-2، به برخی از تحقیقات انجام شده در این حوزه اشاره می کند.

جدول22 برخی از مطالعات صورت گرفته در حوزه مرتبط با توابع کرنل در ماشین بردار پشتیبان( ترتیب سال تحقیق)
نام محقق
سال انتشار
ایده پایه
کمپس والس و همکاران
2004
تابع کرنل سیگموئید فازی
وو و وانگ
2009
انتخاب پارامترهای تابع کرنل
اوزر و همکاران
2011
تابع کرنل چبیشفی
ژانگ و وانگ
2011
تابع کرنل آماری لورنتزیان

همانطور که قبلا نیز ذکر شد، استفاده از توابع کرنل هنگامی مقرون به صرفه است که دقت دسته بندی بسیار پایین بوده و یا بعد از نگاشت دقت دسته بندی تا حد بالایی تغییر کند. زیرا بعد از نگاشت ابعاد مسئله بسیار بالا رفته و سرعت حل تا حد قابل ذکری کاهش خواهد یافت. بنابراین اگر افزایش دقت به سرعت ارجح باشد از توابع کرنل استفاده می شود.

کاربرد ماشین بردار پشتیبان در مدیریت پرتفو

از ماشین بردار پشتیبان در زمینه مباحث مالی استفاده زیادی شده است. زیرا این تکنیک به علت توانایی پیشبینی و دستهبندی بصورت همزمان کاربرد فراوانی دارد. از جمله این استفاده ها میتوان به مدلهای پیش بینی ورشکستگی شرکتها مین و لی42( 2005) رتبهبندی اعتباری مشتریان بانک یا بیمه، پیشبینی روند بازار سرمایه توسط لین یو و همکاران43(2005) پیشبینی قیمت سهام بائو و همکاران44(2005) پیشبینی قیمت اختیارات معامله لیانگ و همکاران45(2009) و…… نام برد. اما در زمینه تشکیل سبد سرمایه و بهینهسازی پرتفو تعداد مقالات انگشت شماری از ماشن بردار پشتیبان استفاده نمودهاند. اولین بار فن و پالانیسوامی(2001) در بورس استرالیا اقدام به گارگیری این تکنیک نمودند. آنان با استفاده از دادههای 10ساله و بر اساس ماشین بردار پشتیبان دو کلاسه سهامها را دستهبندی نمودند. و با استفاده از 25% سهام برتر در طی پنج سال اخیر پرتفو تشکیل دادند و از این پرتفو بازده خیره کننده 5 برابر شاخص بازار را بدست آوردند.
گوپتا و همکاران(2011) با استفاده از ماشین بردار پشتیبان و الگوریتم ژنتیک مدل کاملی جهت تشکیل پرتفو ارائه نمودند. آنان ابتدا سه کلاس بازدهی بالا، نقدشوندگی بالا و ریسک پایین را تعریف نمودند. که این کلاس ها با استفاده از پرسشنامه و برای هر سرمایهگذار بر اساس ترجیحات ذهنی خودش می باشد. سپس با اجرای ماشین بردار پشتیبان به تشکیل سبد سرمایه با تایع هدف چندگانه پرداختند. آنان برای حل این تابع هدف چندگانه از الگوریتم ژنتیک استفاده کردند.
هوانگ(2011) با استفاده از رگرسیون بردار پشتیبان46 مدلی را جهت انتخاب سهام ارائه نمود. وی در این مدل به بهینهسازی همزمان پارامترهای مدل وانتخاب مشخصهها پرداخت. و در این راه از الگوریتم ژنتیک بهره جست. در واقع وی با استفاده از رگرسیون بردار پشتیبان جایگزینی برای بازده واقعی پیشبینی نمود. و بر اساس آن سهامها را رتبهبندی نمود.

مدل تحلیل پوششی دادهها

در این پایان نامه از تحلیل پوششی دادهها جهت مشخص نمودن برچسب دادهها استفاده شده است. لذا ضمن مرور کوتاهی بر ادبیات این مدل، با توجه به استفاده از مدل BCC ورودی محور این مدل نیز ارائه شده است.
تحلیل پوششی دادهها یا DEA یک روش برنامهریزی ریاضی، برای ارزیابی کارآیی واحدهای تصمیمگیرندهای(DMUs) است.که چندین ورودی و چندین خروجی دارند. اندازهگیری کارآیی به دلیل اهمیت آن در ارزیابی عملکرد یک شرکت یا سازمان همواره مورد توجه محققین قرار داشته است.
در سال 1957 فارل47 با استفاده از روشی همانند اندازهگیری کارآیی در مباحث مهندسی، به اندازهگیری کارآیی برای واحد تولیدی اقدام کرد. موردی که فارل برای اندازهگیری کارآیی مد نظر قرار داد، شامل یک ورودی و یک خروجی بود. چارنز، کوپر و رودز دیدگاه فارل را توسعه دادند و الگویی را ارائه کردند که توانایی اندازهگیری کارآیی با چندین ورودی و خروجی را داشت. این الگو، تحت عنوان تحلیل پوششی دادهها، نام گرفت و اول بار، در رساله دکترای، ادوارد رودز و به راهنمایی کوپر تحت عنوان ارزیابی پیشرفت تحصیلی دانشآموزان مدارس ملی آمریکا در سال 1976در دانشگاه کارنگی مورد استفاده قرار گرفت. (مهرگان،1383)
از آن جا که این الگو توسط چارنز48، کوپر49 و رودز50 ارائه گردید، به الگوی CCR که از حروف اول نام سه فرد یاد شده تشکیل شده است، معروف گردید، و در سال 1978، در مقالههای با عنوان اندازهگیری کارآیی واحدهای تصمیم گیرنده، ارائه شد. ( جهانشاهلو، 1389)
استفاده از الگوی تحلیل پوششی دادهها، برای ارزیابی نسبی واحدها، نیازمند تعیین دو مشخصه اساسی، ماهیت الگو و بازده به مقیاس الگو میباشد که در زیر به تشریح هر یک پرداخته میشود.

ماهیت الگوی مورد استفاده
الف) ماهیت (دیدگاه) ورودی، در صورتی که در فرآیند ارزیابی، با ثابت نگه داشتن سطح خروجیها، سعی در حداقلسازی ورودیها داشته باشیم، ماهیت الگوی مورد استفاده ورودی است.
ب) ماهیت (دیدگاه) خروجی، در صورتی که در فرآیند ارزیابی با ثابت نگه داشتن سطح ورودیها، سعی در افزایش سطح خروجی داشته باشیم، ماهیت الگو مورد استفاده خروجی است.
در الگوی DEA با دیدگاه ورودی، به دنبال به دست آوردن ناکارآیی فنی به عنوان نسبتی میباشیم که بایستی در ورودیها کاهش داده شود تا خروجی، بدون تغییر بماند و واحد در مرز کارآیی قرار گیرد. در دیدگاه خروجی، به دنبال نسبتی هستیم که باید خروجیها افزایش یابند، بدون آن که تغییر در ورودیها به وجود آید تا واحد مورد نظر به مرز کارآیی برسد.
در الگوی CCR مقادیر به دست آمده برای کارآیی در دو دیدگاه مساوی هستند؛ ولی در مدل BCC این مقادیر متفاوت هستند. علت انتخاب دیدگاه برای یک الگو DEA در ارزیابی نسبی عملکرد واحدها این است که در بعضی موارد، مدیریت واحد هیچ کنترلی بر میزان خروجی ندارد و مقدار آن از قبل مشخص و ثابت است. مانند نیروگاه برق در این موارد میزان ورودیها، به عنوان متغیر تصمیم میباشد؛ بنابراین، دیدگاه ورودی مورد استفاده قرار میگیرد. و بر عکس در بعضی از موارد میزان ورودی ثابت و مشخص است و میزان تولید (خروجی) متغیر تصمیم است در چنین شرایطی، دیدگاه خروجی مناسب میباشد. در نهایت انتخاب ماهیت (دیدگاه) ورودی و خروجی، بر اساس میزان کنترل مدیر، بر هر یک از ورودیها و خروجیها تعیین میگردد.
بازده به مقیاس الگوی مورد استفاده
بازده به مقیاس بیانگر پیوند بین تغییرات ورودیها و خروجیهای یک سیستم میباشد. یکی از تواناییهای روش تحلیل پوششی دادهها، کاربرد الگوهای مختلف، متناظر با بازده به مقیاسهای متفاوت و هم چنین اندازهگیری بازده به مقیاس واحدهاست.( مهرگان، 1383)
الف: بازده به مقیاس ثابت: بازده به مقیاس ثابت، یعنی هر مضربی از ورودیها همان مضرب از خروجیها را تولید میکند. الگویCCR بازده به مقیاس واحدها را ثابت فرض میکند؛ بنابراین واحدهای کوچک و بزرگ، با هم مقایسه میشوند.
ب :بازده به مقیاس متغیر: بازده به مقیاس متغیر یعنی هر مضربی از ورودیها، میتواند همان مضرب از خروجیها یا کمتر از آن و یا بیشتر از آن را، در خروجیها تولید کند الگوی BCC بازده به مقیاس را، متغیر فرض میکند.
مدل BCC ورودی محور
الگوهای DEA به طور کلی عبارتند از: الگویCCR ، الگویBCC و الگوی جمعی. ( جهانشاهلو، 1389)
با توجه به اینکه در این تحقیق از مدل BCC ورودی محور استفاده گردیده است، لذا تنها این مدل ارائه شده است.
برای ایجاد بازده متغیّر در مدلهای CCR بنکر، چارنز و رودز پیشنهاد کردند که یک متغیر دیگر را به مدل CCR اضافه کنند. لذا تنها تفاوت مدل CCR با مدل BCC در وجود متغیر آزاد در علامت میباشد. در مدل BCC علامت متغیر W بازده به مقیاس را برای هر واحد مشخص میکند.که هرگاه:
1- باشد نوع بازده به مقیاس کاهشی است.
2- نوع بازده به مقیاس ثابت است.
3- نوع بازده به مقیاس افزایشی است.
بنابراین با اضافه شدن متغیّر ، مدل به شکل زیر ایجاد خواهد شد:
(2-24)
با ثابت نگه داشتن مخرج کسر کارایی مدل ورودی محور حاصل میگردد:
(2-25)
فرم پوششی مسأله فوق به شکل زیر خواهد بود:
(2-26)

مطلب مشابه :  پایان نامه با کلید واژگاننقدشوندگی، بورس اوراق بهادار، ماشین بردار پشتیبان، بورس اوراق بهادار تهران

الگوریتم خوشهبندی K-means

در این پایان نامه جهت آمادهسازی دادهها51 و حذف دادههای مغشوش و خارج از محدوده52 از الگوریتم خوشه بندی K-means استفاده شده است. به همین علت مرور اجمالی بر این الگوریتم شده است. الگوریتم K-means جز روشهای افرازی رویکرد خوشهبندی میباشد.
در روشهای افرازی با فرض داشتن یک پایگاه داده با n شی K افراز از این دادههای اشیا درست میکند. بطوریکه هر افراز یک خوشه را نشان میدهدو Kn. پس دادههای اشیا در K گروه خوشهبندی شده و دارای دو شرط زیر میباشند:( غضنفری و همکاران، 1387)
الف- هر گروه حداقل یک شی دارد.
ب- هرشی تنها به یک گروه تعلق دارد.
در روش افرازی برای K معلوم، یک افراز ابتدایی ایجاد میشود. سپس یک روش جابجایی تکراری53را به کار برده که تلاش به بهبود افراز بندی دارد. به این صورت که اشیا را از یک گروه به دیگر گروهها میبرد. یک معیار عمومی برای یک افرازبندی خوب این است که اشیا در یک خوشه به هم نزدیک یا به یکدیگر وابسته باشند و در مقابل اشیا در خوشههای مختلف از یکدیگر دور یا تا حد امکان متفاوت باشند.
در الگوریتم K-mean که هر خوشه با میانگین یا مرکز آن نمایش داده میشود. K را به عنوان ورودی گرفته و مجموعه n شی را به K خوشه افراز میکند. بطوریکه سطح شباهت داخلی خوشهها بالا بوده و سطح شباهت اشیا بیرون خوشهها پایین باشد. شباهت هر خوشه نسبت به متوسط اشیا آن خوشه سنجیده شده که این متوسط مرکز خوشه نیز نامیده میشود. این الگوریتم به صورت زیر کار میکند.(غضنفری و همکاران،1387)
ورودی: K تعداد خوشهها ویک پایگاه داده شامل n شی
خروجی: یک مجموعه از K خوشه که معیار نربع خطا را حداقل کند.
الگوریتم:
به صورت تصادفی K نقطه دلخواه را به عنوان مراکز خوشههای ابتدایی انتخاب کن.( بهتر است K نقطه از n نقطه موجود انتخاب شود.)
هر شی را با توجه به بیشترین شباهت آن به مراکز خوشهها، به خوشهها تخصیص بده.
مراکز خوشهها را به روز کن به این
معنی که برای هر خوشه میانگین اشیا آن خوشه را محاسبه کن.
با توجه به مراکز جدید خوشهها به قدم دوم برگرد تا هنگامی که هیچ تغییری در خوشهها رخ ندهد.
در عمل این الگوریتم یک روش هیوریستیکی برای کاهش معیار مربع خطاست که در رابطهی زیر آمده است:
E=∑▒∑▒|p-m_i |^2 (27-2)
در این رابطه E مجموع مربع خطا برای تمام اشیا پایگاه داده میباشد. P نقطهای در فضاست که نماینگر یک شی میباشد، و mi میانگین خوشه Ciمیباشد که نقطه p به آن متعلق است.
برای روشنتر نمودن نحوه کار این الگوریتم فرض کنید مجموعه {3,2, 4,10,12,20,30,11,25}را میخواهیم به k=2 خوشه افراز کنیم. ابتدا به طور تصادفی دو مرکز m_1=2 و m_2=4 را انتخاب کرده و بقیه اعضا را با توجه به فاصلهی آنها از این دو مرکز تخصیص میدهیم. یعنی هر عضو را به خوشههایی تخصیص میدهیم که به مرکز آن نزدیکتر باشند. خوشههای حاصل عبارتند از :
k_2={4,10,12,20,30,11,25} و k_1={2,3}
حال مراکز جدید را محاسبه میکنیم و تخصیص را نسبت به مراکز جدید انجام میدهیم.( مراکز میانگین اعداد هر دسته است.):
m_1=2/5 و m_2=16
خوشههای جدید عبارتند از:
k_1={2,3,4} و k_2={10,12,20,30,11,25}
روند فوق را آنقدر تکرار میکنیم تا اینکه دیگر تغییری در خوشهها رخ ندهد:
m_1=3 و m_2=18
k_1={2,3,4,10} و k_2={12,20,30,11,25}
m_1=4/75 و m_2=19/6
k_1={2,3,4,10,11} و k_2={20,30,25}
m_1=7 و m_2=25
k_1={2,3,4,10,11} و k_2={20,30,25}
در این مرحله دیگر تغییری در خوشهها رخ نمیدهد. لذا دو خوشهی فوق به دست آمده است و الگوریتم خاتمه مییابد.

مطلب مشابه :  منابع مقاله با موضوعBilly، He، an، Dresden

نسبت های مالی

با توجه به اینکه در این پایان نامه مجموعه دادهها بر اساس نسبتهای مالی شکل گرفته است. نیاز مبرمی به مرور ادبیاتی بر روی دادههای بنیادی استفاده شده در دیگر تحقیقات مالی بوجود آمد. در واقع در این پایان نامه که اساس آن بر تحلیل بنیادی استوار است، دانستن اینکه چه نسبتهای مالی در این مدل موثر است بسیار ضروری است به خصوص آنکه از یک تکنیک یادگیرنده استفاده شده است.
در بین مقالاتی که از ماشین بردار پشتیبان برای انتخاب سهام و نهایتا تشکیل پرتفوی بهینه استفاده کرده بودند، فن و پالانیسوامی(2001) دادههایی را که به نوعی بیانگر بازده سرمایه، ریسک، نسبتهای اهرمی، سود سرمایهگذاری، سودآوری، رشد، نقدینگی کوتاه مدت و سرمایهگذاری باشند را استفاده نمودند. هوانگ(2011) قیمت ذاتی سهام، سودآوری، نسبتهای اهرمی، رشد، نقدینگی و کارایی را به عنوان نسبتهای معیار درنظر گرفت. مقیسه(1391) در پایان نامهای تحت عنوان بازنگری سبد سهام 5 خوشه سودآوری، رشد، چشم انداز شرکت، ساختار سرمایه وعملکرد سهام را در نظر گرفت و برای هر کدام از آنان نسبت مالی مربوطه را قرار داد. بابیک و پلازبیت54(1998) جهت توصیه های معاملاتی از 4 گروه نسبت بدهی، شاخص اقتصادی، شاخص سودآوری و شاخص بهرهوری استفاده نمودند. جانسون و سوئن55(2003) از شاخصهای سودآوری، نرخ رشد پایدار، اندازه شرکت، سود مورد انتظار، پوشش بدهی، ریسک سرمایه و… استفاده کردند. نوروش(1387) جهت رتبهبندی شاخص شرکتهای موفق از نسبتهای سودآوری و رشد و ریسک خطر سرمایه بهره جست. کرمی(1387) در بررسی تحلیلی نقش نسبتهای مالی د

دیدگاهتان را بنویسید