میتوان آزمون هاسمن را به روشی نسبتاً سادهتر با بهره گرفتن از رابطه زیر انجام داد:
به طوری که معرف تخمینهای روش اثرات ثابت و نشاندهندهی اثرات تصادفی است. این آزمون در حقیقت آزمون فرضیه نا همبسته بودن اثرات ثابت انفرادی و متغیر های توضیحی است که طبق آن تخمینهای حداقل مربعات تعمیم یافته (GLS)[93] تحت فرضیه سازگار و تحت فرضیه ناسازگار است. از سوی دیگر، تخمینهای اثرات ثابت تحت هر دو فرضیه سازگار اما تنها تحت فرضیه کارا میباشند. بنابراین، در صورتی که فرضیه قابل رد کردن نباشد، روش اثرات تصادفی به روش اثرات ثابت ترجیح داده میشود و به عنوان روش مناسبتر و کاراتر انتخاب میگردد در غیر این صورت روش اثرات ثابت کارا است (محمد زاده و همکاران، ۱۳۸۹).
استفاده از رگرسیون چند متغیر ه نیازمند برقراری پیشفرضهایی است. در عمل کنترل و تحقق تمامی این پیشفرضها نه مرسوم و نه عملی است و حتی برخی صاحبنظران کنترل و تحقق تمامی این پیشفرضها را ضروری نمیدانند (سرمد، بازرگان و حجازی، ۱۳۸۷).در دادههای تابلویی ( پانلی) نیز مانند دادههای سری زمانی میتوان بحثهای مربوط به ناهمسانی واریانس و همچنین خود همبستگی را مطرح نمود.
۳-۹-۵- آزمونهای ناهمسانی واریانس،خود همبستگی و آزمون هم خطی
در صورتی که دوره زمانی مورد مطالعه در دادههای ترکیبی نسبت به تعداد واحدهای انفرادی بیشتر است، انتظار میرود بحث خود همبستگی بین اجزاء خطاء باقی ماندهموضوعیت داشته باشد و در صورتی که تعداد واحدهای انفرادی بیشتر از دوره زمانی مورد مطالعه است، میتوان انتظار داشت که اجزاء خطاء باقی ماندهدارای ناهمسانی واریانس باشند؛ لذا لازم است هر یک از این موارد مورد آزمون قرار گیرد. برای انجام آزمون ناهمسانی واریانس در داده های ترکیبی مبتنی بر روش تابلویی، بین جملات اختلال، دو مدل رگرسیون مقید و نامقید تخمین زده میشود. در مدل مقید فرض همسانی واریانس یا فرض توزیع یکسان و مستقل[۹۴] در نظر گرفته میشود در حالی که در مدل نامقید فرض بر یکسان نبودن واریانس جملات خطا بین واحدهای مقطعی (ناهمسانی واریانس) میباشد. در روش حداقل مربعات تعمیم یافته، هر دو مدل فوق تخمین زده میشوند و سپس بر اساس آماره آزمون نسبت درستنمایی[۹۵]و با بهره گرفتن از رابطه زیر به آزمون فرضیه ناهمسانی واریانس پرداخته میشود.
در رابطه فوق لگاریتم راست نمایی مدل نامقید و لگاریتم راست نمایی در مدل مقید میباشد. در صورتی که پس از انجام آزمون ناهمسانی واریانس، فرضیه صفر رد گردد در آن صورت لازم است از روش حداقل مربعات تعمیم یافته[۹۶] استفاده شود (محمد زاده و همکاران، ۱۳۸۹).آزمون وایت، آزمونی جهت بررسی همسانی واریانس است که در داده های ترکیبی مبتنی بر روش تلفیقی استفاده میشود. در این آزمون فرضیه صفر بیانگر همسانی واریانس در اجزاء خطاء باقی ماندهمیباشد. بنابراین، هنگامی که در این آزمون فرضیه صفر رد گردد؛ میتوان استنباط نمود که در مدل برازش شده مشکل ناهمسانی واریانس وجود دارد که در این صورت باید از روش حداقل مربعات تعمیم یافته استفاده شود.
یکی دیگر از پیش فرضهای رگرسیون، عدم وجود هم خطی بین متغیر های توضیحی ( شامل متغیر های مستقل و متغیر های کنترلی) میباشد. هم خطی آزمونی است که نشان میدهد یک متغیر مستقل، تابعی خطی از سایر متغیر های مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد، بدین معنی است که بین متغیر های مستقل، همبستگی بالایی وجود دارد و ممکن است با وجود بالا بودن R2، مدل دارای اعتبار بالایی نباشد. به عبارت دیگر، با وجود آنکه مدل خوب به نظر میرسد، ولی دارای متغیر های مستقل معنی داری نمیباشد. در پژوهش جاری برای بررسی این پیش فرض از آزمون وی ای اف[۹۷] استفاده خواهد شد.
یکی از مفروضاتی که در رگرسیون مد نظر قرار میگیرد، استقلال خطاها از یکدیگر است. این فرض از طریق آزمون دوربین - واتسون مورد بررسی قرار میگیرد. مقدار آماره این آزمون در دامنه ۰ و ۴ قرار میگرید. چنانچه این آماره در بازه ۱٫۵ تا ۲٫۵ قرار گیرد H0 آزمون (عدم همبستگی بین خطاها) پذیرفته میشود و در غیر این صورت H0 رد میشود. لازم به ذکر است که در صورت رد فرض H0، نمیتوان از آزمون رگرسیون استفاده کرد.
در ادامه مزیتهای استفاده از دادهای ترکیبی به صورت خلاصه ارائه میگردد.
۳-۱۰- مزیت استفاده از دادههای ترکیبی نسبت به سری زمانی و مقطعی
الف- دادههای ترکیبی اطلاعات بیشتر، تنوع یا تغییرپذیری بیشتر، هم خطی کمتر بین متغیرها، درجات آزادی و کارایی بیشتر را فراهم میکند. در حالی که سری زمانی گرفتار هم خطی میباشند. در دادههای ترکیبی با توجه به اینکه ترکیبی از سری زمانی و مقطعی میباشد، بعد مقطعی موجب اضافه شدن تغییرپذیری یا تنوع بسیار زیادی میشود که با در دست داشتن این اطلاعات میتوان برآوردهای معتبرتری انجام داد. مزیت عمده در دادههای ترکیبی استفاده از دادههای گروهی است یعنی دادههای مرکب از یک سری زمانی از نمونههای مقطعی بالقوه که از نظر اطلاعات، غنیتر از نمونه مقطعی (N) خواهد بود و اگر صرفاً از سری زمانی استفاده شود تنها به اندازه مشاهدات (T) خواهد بود، اما با ترکیب این دو، تعداد دادهها به اندازه تعداد مقاطع ضربدر تعداد مشاهدات (N.T) افزایش خواهد یافت که این امر میتواند منجر به برآوردهای کاراتری از پارامترها شود. مقدار F در مدل تلفیقی میتواند بزرگتر از مدل سری زمانی باشد و لذا احتمال معنیدار بودن کل رگرسیون یعنی وجود متغیرهای توضیحی در مدل تلفیقی بیشتر خواهد بود.
ب-دادههای ترکیبی امکان طراحی الگوهای رفتاری پیچیدهتری نسبت به دادههای مقطعی و سری زمانی فراهم میکند. برای مثال به وسیله داده های ترکیبی امکان بهتری برای بررسی و مدلسازی کارایی تکنیکی وجود دارد.
ج- دادههای ترکیبی امکان بیشتری برای شناسایی و اندازهگیری اثراتی را فراهم میکند که به وسیله فقط آمارهای مقطعی و یا سری زمانی به سادگی قابل شناسایی نیست.
د- دادههای ترکیبی از واحدهای کوچکی مثل افراد، شرکتها و خانوارها گردآوری میشوند. خیلی از متغیرها را میتوان در مقیاس کوچک با دقت بیشتری اندازهگیری نمود و انحرافهای ناشی از تجمع افراد یا شرکتها حذف میشوند.
امتیاز دیگری که برای ترکیب کردن دادهها میتوان در نظر گرفت این است که استفاده از مشاهدات مقطعی ممکن است منجر به برآوردهای اریبی از پارامترها شود. چنانچه از این برشهای مقطعی طی زمان نمونهگیری شود و به اصطلاح دادههای گروهی فراهم شود برآوردهای نا اریب و سازگاری امکان پذیر است (مرادی جز، ۱۳۹۱).
خلاصهی فصل
در این فصل روششناسی، جامعه و نمونه آماری، روشهای گردآوری اطلاعات و روشهای آماری تجزیه و تحلیل آنها، فرضیه و مدل تجربی مورد استفاده برای آزمون آن تشریح گردید. پژوهش حاضر، از نوع پژوهشهای کاربردی است و از منظر نوع مطالعه و نحوهی گردآوری دادهها میدانی-کتابخانهای میباشد. این پژوهش به بررسی رابطه بین تعداد دفعات پیش بین سود، هزینه حقوق صاحبان سهام و عدم تقارن اطلاعاتی ایران، میپردازد. مشاهدات مورد بررسی در این پژوهش مشتمل بر تعدادی از شرکتهای پذیرفتهشده در بورس اوراق بهادار تهران در فاصله زمانی سالهای ۱۳۸۹ تا ۱۳۹۳ میباشند.
در فصل آتی با بهره گرفتن از روشهای اندازهگیری و مدلهای معرفی شده در این فصل و در قالب چارچوب نظری که در فصل دو و تا حدی در فصل حاضر تبیین گردید، فرضیه های پژوهش بر اساس دادههای گردآوری شده مورد تجزیه و تحلیل و بررسی آماری قرار خواهند گرفت.
فصل چهارم
تجزیه وتحلیل داده ها
۴-۱مقدمه
در فصل چهارم به بررسی الگوهای ارائه شده و تفسیر نتایج پرداخته شده است. در این مطالعه مدلهای برآورد شده براساس داده های ترکیبی است، از این رو ابتدا بایستی از پایا بودن متغیرها از طریق آزمونهای مانایی مختص داده های تلفیقی اطمینان حاصل کرد و در قدم بعدی به منظور بررسی رابطه بین متغیرهای مدل، از آزمون همجمعی استفاده شده است. پس از حصول اطمینان از مانا بودن داده ها، مدلها برآورد و تفسیر شده اند. در برآورد مدلها براساس رویکرد داده های تلفیقی ابتدا به منظور تعیین Pool یا Panel بودن مدل از آزمون F لیمر استفاده شده است. و در مرحله بعد آزمون هاسمن به منظور تعیین روش اثرات ثابت و یا روش اثرات تصادفی انجام شده است.
۴-۲-آمار توصیفی
در تجزیه و تحلیل توصیفی[۹۸]، پژوهشگر با بهره گرفتن از جداول و شاخص های آمار توصیفی نظیر شاخص های مرکزی[۹۹] و پراکندگی[۱۰۰] به توصیف داده های جمعآوری شده پژوهش می پردازد. این امر به شفافیت و توضیح داده های پژوهش کمک بسیاری می کند. نتایج حاصل از تجزیه و تحلیل توصیفی داده ها در جداول (۴-۱)، (۴-۲) و (۴-۳) ارائه شده است.
تعداد مشاهدات پژوهش حاضر ۶۷۸ شرکت است. این مشاهدات حاصل از ترکیب دادههای ۱۱۰ شرکت پذیرفته شده در بورس بهعنوان داده های مقطعی، در طول ۵ سال(۱۳۸۹ تا ۱۳۹۳)، بعنوان دوره مورد مطالعه میباشد.
اصلیترین شاخص مرکزی، میانگین است که نشاندهنده نقطه تعادل و مرکز ثقل توزیع است. میانه نشان میدهد که نیمی از داده ها کمتر از این مقدار و نیمی دیگر بیشتر از این مقدار هستند. به طور کلی پارامترهای پراکندگی، معیاری برای تعیین میزان پراکندگی از یکدیگر یا میزان پراکندگی آنها نسبت به میانگین است. از مهمترین پارامترهای پراکندگی، انحراف معیار است.
جدول ۴-۱٫ میانگین و انحراف معیار نمره متغیرهای پژوهش از ۱۳۹۳-۱۳۸۹
انحراف معیار | میانگین | حداکثر | حداقل | تعداد | متغیر |
۲۱۰/۶۴ | ۳۶۲/۱۱۹ | ۱۲۶۵/۲۳ | ۳۳۶۲/۲۱ | ۵۵۰ | تعداد دفعات پیش بینی سود مدیریت |