ژانویه 18, 2021

روش حداقل مربعات معمولی

داده‌های سری زمانی، مقادیر یک متغیر را در نقاط متوالی در زمان، اندازه‌گیری می‌کند. این توالی می‌تواند سالانه، فصلی، ماهانه، هفتگی یا حتی به صورت پیوسته باشد. داده‌های مقطعی، مقادیر یک متغیر را در زمان معین و روی واحدهای متعدد اندازه‌گیری می‌کند. داده‌های ترکیبی روشی برای تلفیق داده‌های مقطعی و سری زمانی است. به طور کلی باید گفت داده‌های ترکیبی تحلیل‌های تجربی را به شکلی غنی می‌سازند که در صورت استفاده از داده‌های سری زمانی یا مقطعی این امکان وجود ندارد. [17]. به همین خاطر پژوهشگر با استفاده از داده‌های ترکیبی اقدام به تخمین مدل‌ها خواهد نمود.
مزایای استفاده از داده‌های ترکیبی:
از آنجا که داده‌های ترکیبی به افراد، بنگاه‌ها، کشورها و از این قبیل واحدها طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود می‌شود.
با ترکیب مشاهدات سری زمانی و مقطعی، داده‌های ترکیبی با اطلاعات بیشتر، تغییرپذیری بیشتر، هم‌خطی کمتر میان متغیرها و درجات آزادی بیشتر، کارایی بالاتری را ارائه می‌نمایند.
با مطالعه مشاهدات مقطعی تکراری، داده‌های ترکیبی به منظور مطالعه پویای تغییرات، مناسب‌تر و بهترند.
داده‌های ترکیبی تأثیراتی را که نمی‌توان به سادگی در داده‌های مقطعی و سری زمانی مشاهده کرد، بهتر معین می‌کند.
داده‌های ترکیبی با ارائه داده برای هزاران واحد، می‌توانند تورشی را که ممکن است در نتیجه لحاظ افراد یا بنگاه‌ها حاصل شود، حداقل سازد.
3-8 روش‌های تخمین با استفاده از داده‌های ترکیبی
داده‌های ترکیبی را می‌توان به دو روش تلفیقی و تابلویی تخمین زد. هنگامی که داده‌ها روی هم انباشته می‌شوند و اختلاف بین مقاطع نادیده انگاشته می‌شود از روشی که اصطلاحاً به آن روش داده‌های تلفیقی می‌گویند، استفاده می‌شود. در این روش مشاهدات مربوط به داده‌های مقطعی در طول چندین دوره قادر است کلیه تفاوت‌های میان واحدهای مقطعی و زمان را توضیح دهد. در صورتی‌که تفاوت‌های فردی از اهمیت برخوردار باشد استفاده از روش داده‌های تلفیقی چندان مناسب نیست. در چنین شرایطی روش داده‌های تابلویی با حذف محدودیت یکسان بودن اثرات فردی این مشکل را تقلیل می‌دهد. به عبارت دیگر داده‌های تابلویی را می‌توان با در نظر گرفتن آثار فردی و ناهمگنی میان افراد به یکی از روش‌های اثرات ثابت یا اثرات تصادفی تخمین زد. در روش اثرات ثابت، تفاوت بین گروه‌ها در عرض از مبدأ نمود پیدا می‌کند و فرض می‌شود که هر گروه در طول زمان دارای یک عرض از مبدأ ثابت است. اما در روش اثرات تصادفی، ناهمگنی بین گروه‌ها به عوامل تصادفی نسبت داده می‌شود و برآیند این اثرات تصادفی برای هر گروه محاسبه شده و به صورت یک جزء خطا از دو بخش تشکیل شده است که بخش دوم بیانگر تفاوت‌های بین گروهی است. به عبارت دیگر تفاوت روش اثرات ثابت و اثرات تصادفی در این است که در روش اثرات ثابت، ناهمسانی‌ها به عوامل ثابتی که بین گروه‌ها متفاوتند نسبت داده می‌شود. بنابراین برای هر گروه یک عرض از مبدأ ثابت داریم. اما در روش اثرات تصادفی عرض از مبدأ مخصوص هر گروه، حالت تصادفی دارد زیرا از جمع عرض از مبدأ مشترک یک جزء تصادفی حاصل می‌شود.
در پژوهش حاضر داده‌ها از نوع ترکیبی می‌باشند. به منظور تشخیص اینکه از کدام روش (تلفیقی یا تابلویی) برای تخمین استفاده شود و در صورت پذیرفته شدن روش تابلویی کدام مدل (اثرات ثابت یا اثرات تصادفی) به کار گرفته شود، مستلزم آزمون فرضیه‌هایی می‌باشد که در ادامه به توضیح آن‌ها پرداخته می‌شود.
3-8-2 آزمون لیمر
برای انتخاب یکی از روش‌های تلفیقی یا تابلویی از آماره F لیمر استفاده می‌شود. این آزمون مقایسه بین مجموع مربعات جملات خطا (RSS) در روش داده‌های تابلویی و تلفیقی می‌باشد. از آنجا که در روش داده‌های تلفیقی پارامترهای محدود کننده بیشتری (از قبیل ضرایب عرض از مبدأ در طول زمان و در بین داده‌های مقطعی ثابت در نظر گرفته می‌شود) وجود دارد؛ لذا انتظار بر این است که روش داده‌های تلفیقی نسبت به روش داده‌های تابلویی، RSS بیشتری داشته باشد. بنابراین اگر RSS روش حداقل مربعات معمولی (OLS)، با اضافه شدن محدودیت‌ها به طور معنی‌داری افزایش پیدا نکند بهتر است که از این روش استفاده شود. در غیر این صورت روش داده‌های تابلویی مناسب‌تر است. در این آزمون، مدل تلفیقی به عنوان مدل مقید و مدل اثرات تصادفی به عنوان مدل غیرمقید شناخته می‌شوند. بنابراین در این آزمون مجموع مربعات باقی‌مانده مدل مقید و مدل غیرمقید با هم مقایسه می‌شود:
که در آن K نشان‌دهنده متغیرهای توضیحی است و N نماینده مقاطع می‌باشد. (N-1) تعداد درجات آزادی در مدل مقید و (NT-N-K) نیز تعداد درجه آزادی در مدل غیرمقید می‌باشد.
در این آزمون فرضیه مبنی بر یکسان بودن عرض از مبدأهاست. بدین معنی که اختلاف درون گروهی خیلی شدید نبوده و نیازی به استفاده از روش داده‌های تابلویی نمی‌باشد. در مقابل فرضیه یکسان نبودن عرض از مبدأها را نشان می‌دهد و استفاده از روش داده‌های تابلویی را توصیه می‌کند.
=

چنانچه F محاسبه شده، از F جدول با درجه آزادی (N-1) و (NT-N-K) بزرگ‌تر باشد، فرضیه مبنی بر پذیرش داده‌های تلفیقی را نمی‌توان پذیرفت، بنابراین روش داده‌های تابلویی ارجحیت دارد.
لازم به ذکر است که آزمون فرضیه‌های تحقیق در سطح اطمینان 95% (خطای 5%) انجام می‌شود.
3-8-3 آزمون چاو
به منظور انتخاب بین مدل داده‌های تلفیقی و مدل اثر، ثابت فروض زیر را داریم:

ضریب متغیر موهومی در مدل اثر ثابت است.
قبول فرض به معنی وجود داده‌های تلفیقی و استفاده از تخمین OLS برای حل مدل است. رد فرض به معنی وجود مدل اثر ثابت و استفاده از LSDV برای حل مدل می‌باشد.