۵
۲۰
۰٫۰۲۳
۵
۲۰-۱۵-۱۰-۵
۰٫۰۰۴
۵
۵-۱۰-۱۵-۲۰
۰٫۰۱۰
همانگونه که در جدول ۴-۴ مشخص شده است، میانگین مربعات خطا در پنج لایه با تعداد نورون ۲۰-۱۵-۱۰-۵ کمتر است ودر جدول پررنگ شده است. بنابراین استفاده از مدل از پرسپترون چندلایه برای انجام آموزش مناسب است. میانگین مربعات خطا به کمک رابطه ۴-۵ محاسبه می شود.در این رابطه مقدار پیش بینی شده، مقدار واقعی و Nاندازه مجموعه دادهاست.
(۴-۵)
۴-۷ تحلیل نتایج
روش پیشنهادی ارائه شده توسط جعبه ابزار شبکه عصبی نرمافزار MATLABپیادهسازی شده است. شبکه عصبی مورد استفاده در این تحقیق، یک شبکه عصبی پنج لایه پرسپترون میباشد که لایه های آن بهترتیب ۲۰،۱۵،۱۰،۵ میباشند. الگوریتم مورد استفاده برای آموزش پارامترها، الگوریتم پس انتشار خطا می باشد. برای آموزش از ۱۰۰ داده استفاده شده است. ۶۰ داده برای آموزش، ۲۰ داده برای ارزیابی و ۲۰ داده برای آزمون انتخاب شده است. این داده ها به فرم اکسل و با سایز پنجره سه آماده شده است. تعداد داده های هدف نیز ۱۰۰میباشد. تابع انتقال انتخاب شده برای نورونها TANSIGاست. تابع آموزش TRAINLMاست. تابع یادگیری تطبیق LEARNGDMاست. تابع عملکرد از نوع مربعات میانگین خطا (MSE) است. قابل ذکر است که این شرایط برای هرسه نوع داده تکنیکی، بنیادی و ترکیب تکنیکی و بنیادی به طور یکسان در نظر گرفته شده است. این نکته قابل ذکر است که TANSIG یک تابع انتقال است. تابع انتقال برای تعیین خصوصیات نورون در راستای حل مسائل مختلف استفاده می شود. نمایش وضعیت این تابع در شکل ۴-۳ نشان داده شده است. در شکل ۴-۴ وضعیت کلی شبکهعصبی بهعنوان نمونه آورده شده است. اطلاعاتی شامل تابع مورد استفاده، تعداد لایه، دوره، زمان آموزش و آزمون در شکل ۴-۵ نشان داده شده است.
شکل ۴-۳: عملکرد تابعTANSIG.
در شکل ۴-۵ وضعیت شبکه عصبی و ساختار هر لایه نشان داده شده است. این شبکه از یک ورودی، پنج لایه مخفی و یک خروجی تشکیل شده است که در هر لایه وزن و بایاس و نوع تابع انتقال مشخص شده است. پس از تعیین و نمایش ساختار، مشخصات شبکه عصبی مورد استفاده به طور کامل نمایش داده می شود. این خصوصیات شامل نمایش شبکه عصبی انتخابی، الگوریتمهای بهکار رفته (نوع الگوریتم آموزشی و عملکردآن) میزان پیشرفت کار به کمک دوره، زمان، گرادیان و ارزیابی، نمودارهای عملکرد، وضعیت آموزش و رگرسیون می شود.
شکل۴-۴: وضعیت شبکهعصبی انتخاب شده برای آموزش، ارزیابی و آزمون.
شکل۴-۵: نمونه ای از وضعیت کلی داده های بنیادی.
پس از آماده سازی و نرمال سازی داده ها، بر مبنای معماری مناسب مراحل آموزش، ارزیابی و آزمایش مطابق مرحله چهارم روندنمای شکل۴-۱ انجام می شود. همانطور که در شکل ۴-۶ مشخص شده است، معیار سنجش، میانگین مربعات خطا است که بهترین وضعیت در سومین دوره زمانی با مقدار ۰٫۰۱۲۵ انجام گرفته است. در شکل ۴-۷ این مراحل برای داده های تکنیکی انجام شده است که بهترین وضعیت در دوره زمانی چهار با مقدار ۰٫۰۱۸ انجام شده است. در شکل ۴-۸ این مراحل برای ترکیب داده های بنیادی و تکنیکی صورت گرفته است که بهترین حالت در دوره زمانی ۲۰ با مقدار ۰٫۰۰۴ انجام شده است. هرچند دوره زمانی داده های ترکیبی بیشتر است اما مقدار خطای کمتر نشان دهنده بهتر بودن داده های ترکیبی است. بررسی میزان خطا به کمک میانگین مربعات خطا مورد بررسی قرار میگیرد. بنابراین مطابق شکل ۴-۶ هرچقدر کاهش بیشتر در میزان خطا انجام شود بهتر است. نکته دیگر اینکه هر قدر میزان خطا کمتر باشد بهتر است. در شکل۴-۶ میزان خطا ۰٫۰۱۲ است که در دوره زمانی سه به دست آمده است. آشکار است که هر چقدر از لحاظ دوره زمانی زودترخطا شناسایی شود بهتر است.
شکل۴-۶: عملکرد داده های بنیادی.
شکل۴-۷: عملکرد داده های تکنیکی.
در شکل ۴-۷ بر اساس خصوصیات ذکر شده برای داده های تکنیکی، میزان خطا ۰٫۰۱۸ است که از میزان خطای داده های تکنیکی بیشتر است. از نظر دوره زمانی هم در دوره چهارم اتفاق افتاده است که از این نظر هم داده های بنیادی بهتر عمل کرده است. در شکل ۴-۸ برای داده های ترکیبی (ترکیب داده های بنیادی و تکنیکی) هرچند دوره زمانی طولانی شده است اما میزان خطا به ۰٫۰۰۴ کاهش یافته است.
شکل۴-۸: عملکرد داده های ترکیبی
برای ارزیابی داده ها، نمودار رگرسیون از نمودار میانگین مربعات خطا دقیقتر است و اعتماد به این نمودار بیشتر است[۶۳]. شکل ۴-۹ رگرسیون داده های بنیادی را نشان میدهد. هرچه داده های بیشتری با آنچه که مورد انتطار است مطابقت داشته باشند آنگاه آموزش، ارزیابی وآزمایش دقیقتر و موفقتر است و درنتیجه رگرسیون مقدار بالاتری را نشان میدهد.
شکل۴-۹: رگرسیون داده های بنیادی.
در شکل ۴-۹ مقدار رگرسیون نهایی برای داده های بنیادی ۰٫۸۷۹ است که در مقایسه با شکل ۴-۱۰ این مقدار رگرسیون که برای داده های تکنیکی ۰٫۸۶۶۹ است، نشاندهنده برتری داده های بنیادی نسبت به داده های تکنیکی است زیرا داده های تکنیکی بهتر توانسته اند مورد آموزش واقع شوند و خود را با آنچه مورد انتظار است تطبیق دهند (مقایسه بین داده های به دست آمده و داده های واقعی). در شکل ۴-۱۱ که داده های آن از ترکیب داده های بنیادی و تکنیکی ایجاد شده اند، مقدار رگرسیون به ۰٫۹۱۱ رسیده است که از رگرسیونهای داده های تکنیکی و بنیادی مناسبتر است.
شکل ۴-۱۰: رگرسیون دادههای تکنیکی.
شکل۴-۱۱: رگرسیون داده های ترکیبی.
درجدول ۴-۴ به مقایسه وضعیت داده ها به طور خلاصه پرداخته شده است. همانطور که مشخص است بهترین وضعیت مربوط به داده های ترکیبی است و پس از آن داده های بنیادی مناسبتر از داده های تکنیکی هستند. به طور کلی میتوان گفت اگر شرکتهای سهامدار در بورس اوراق بهادار به صورت ماهیانه و سالیانه دادههایشان را به بورس اوراق بهادار ارائه دهند، شرکتهای سهامدار با اطلاعات بیشتر و دقیقتری میتوانند در امر سرمایه گذاری موفق شوند. زیرا بر اساس جدول ۴-۵ مشخص شده است که ترکیب داده های بنیادی و تکنیکی موجب موفقیت بیشتر در امر پیش بینی خواهد شد.
جدول ۴-۵: مقایسه وضعیت داده ها پس از آموزش، ارزیابی و آزمون.
نوع داده
میزان میانگین مربعات خطا
میزان رگرسیون داده ها ددرصد
بنیادی
۰٫۰۱۲