دادههای سری زمانی، مقادیر یک متغیر را در نقاط متوالی در زمان، اندازهگیری میکند. این توالی میتواند سالانه، فصلی، ماهانه، هفتگی یا حتی به صورت پیوسته باشد. دادههای مقطعی، مقادیر یک متغیر را در زمان معین و روی واحدهای متعدد اندازهگیری میکند. دادههای ترکیبی روشی برای تلفیق دادههای مقطعی و سری زمانی است. به طور کلی باید گفت دادههای ترکیبی تحلیلهای تجربی را به شکلی غنی میسازند که در صورت استفاده از دادههای سری زمانی یا مقطعی این امکان وجود ندارد. [17]. به همین خاطر پژوهشگر با استفاده از دادههای ترکیبی اقدام به تخمین مدلها خواهد نمود.
مزایای استفاده از دادههای ترکیبی:
از آنجا که دادههای ترکیبی به افراد، بنگاهها، کشورها و از این قبیل واحدها طی زمان ارتباط دارند، وجود ناهمسانی واریانس در این واحدها محدود میشود.
با ترکیب مشاهدات سری زمانی و مقطعی، دادههای ترکیبی با اطلاعات بیشتر، تغییرپذیری بیشتر، همخطی کمتر میان متغیرها و درجات آزادی بیشتر، کارایی بالاتری را ارائه مینمایند.
با مطالعه مشاهدات مقطعی تکراری، دادههای ترکیبی به منظور مطالعه پویای تغییرات، مناسبتر و بهترند.
دادههای ترکیبی تأثیراتی را که نمیتوان به سادگی در دادههای مقطعی و سری زمانی مشاهده کرد، بهتر معین میکند.
دادههای ترکیبی با ارائه داده برای هزاران واحد، میتوانند تورشی را که ممکن است در نتیجه لحاظ افراد یا بنگاهها حاصل شود، حداقل سازد.
3-8 روشهای تخمین با استفاده از دادههای ترکیبی
دادههای ترکیبی را میتوان به دو روش تلفیقی و تابلویی تخمین زد. هنگامی که دادهها روی هم انباشته میشوند و اختلاف بین مقاطع نادیده انگاشته میشود از روشی که اصطلاحاً به آن روش دادههای تلفیقی میگویند، استفاده میشود. در این روش مشاهدات مربوط به دادههای مقطعی در طول چندین دوره قادر است کلیه تفاوتهای میان واحدهای مقطعی و زمان را توضیح دهد. در صورتیکه تفاوتهای فردی از اهمیت برخوردار باشد استفاده از روش دادههای تلفیقی چندان مناسب نیست. در چنین شرایطی روش دادههای تابلویی با حذف محدودیت یکسان بودن اثرات فردی این مشکل را تقلیل میدهد. به عبارت دیگر دادههای تابلویی را میتوان با در نظر گرفتن آثار فردی و ناهمگنی میان افراد به یکی از روشهای اثرات ثابت یا اثرات تصادفی تخمین زد. در روش اثرات ثابت، تفاوت بین گروهها در عرض از مبدأ نمود پیدا میکند و فرض میشود که هر گروه در طول زمان دارای یک عرض از مبدأ ثابت است. اما در روش اثرات تصادفی، ناهمگنی بین گروهها به عوامل تصادفی نسبت داده میشود و برآیند این اثرات تصادفی برای هر گروه محاسبه شده و به صورت یک جزء خطا از دو بخش تشکیل شده است که بخش دوم بیانگر تفاوتهای بین گروهی است. به عبارت دیگر تفاوت روش اثرات ثابت و اثرات تصادفی در این است که در روش اثرات ثابت، ناهمسانیها به عوامل ثابتی که بین گروهها متفاوتند نسبت داده میشود. بنابراین برای هر گروه یک عرض از مبدأ ثابت داریم. اما در روش اثرات تصادفی عرض از مبدأ مخصوص هر گروه، حالت تصادفی دارد زیرا از جمع عرض از مبدأ مشترک یک جزء تصادفی حاصل میشود.
در پژوهش حاضر دادهها از نوع ترکیبی میباشند. به منظور تشخیص اینکه از کدام روش (تلفیقی یا تابلویی) برای تخمین استفاده شود و در صورت پذیرفته شدن روش تابلویی کدام مدل (اثرات ثابت یا اثرات تصادفی) به کار گرفته شود، مستلزم آزمون فرضیههایی میباشد که در ادامه به توضیح آنها پرداخته میشود.
3-8-2 آزمون لیمر
برای انتخاب یکی از روشهای تلفیقی یا تابلویی از آماره F لیمر استفاده میشود. این آزمون مقایسه بین مجموع مربعات جملات خطا (RSS) در روش دادههای تابلویی و تلفیقی میباشد. از آنجا که در روش دادههای تلفیقی پارامترهای محدود کننده بیشتری (از قبیل ضرایب عرض از مبدأ در طول زمان و در بین دادههای مقطعی ثابت در نظر گرفته میشود) وجود دارد؛ لذا انتظار بر این است که روش دادههای تلفیقی نسبت به روش دادههای تابلویی، RSS بیشتری داشته باشد. بنابراین اگر RSS روش حداقل مربعات معمولی (OLS)، با اضافه شدن محدودیتها به طور معنیداری افزایش پیدا نکند بهتر است که از این روش استفاده شود. در غیر این صورت روش دادههای تابلویی مناسبتر است. در این آزمون، مدل تلفیقی به عنوان مدل مقید و مدل اثرات تصادفی به عنوان مدل غیرمقید شناخته میشوند. بنابراین در این آزمون مجموع مربعات باقیمانده مدل مقید و مدل غیرمقید با هم مقایسه میشود:
که در آن K نشاندهنده متغیرهای توضیحی است و N نماینده مقاطع میباشد. (N-1) تعداد درجات آزادی در مدل مقید و (NT-N-K) نیز تعداد درجه آزادی در مدل غیرمقید میباشد.
در این آزمون فرضیه مبنی بر یکسان بودن عرض از مبدأهاست. بدین معنی که اختلاف درون گروهی خیلی شدید نبوده و نیازی به استفاده از روش دادههای تابلویی نمیباشد. در مقابل فرضیه یکسان نبودن عرض از مبدأها را نشان میدهد و استفاده از روش دادههای تابلویی را توصیه میکند.
=
چنانچه F محاسبه شده، از F جدول با درجه آزادی (N-1) و (NT-N-K) بزرگتر باشد، فرضیه مبنی بر پذیرش دادههای تلفیقی را نمیتوان پذیرفت، بنابراین روش دادههای تابلویی ارجحیت دارد.
لازم به ذکر است که آزمون فرضیههای تحقیق در سطح اطمینان 95% (خطای 5%) انجام میشود.
3-8-3 آزمون چاو
به منظور انتخاب بین مدل دادههای تلفیقی و مدل اثر، ثابت فروض زیر را داریم:
ضریب متغیر موهومی در مدل اثر ثابت است.
قبول فرض به معنی وجود دادههای تلفیقی و استفاده از تخمین OLS برای حل مدل است. رد فرض به معنی وجود مدل اثر ثابت و استفاده از LSDV برای حل مدل میباشد.