نوامبر 25, 2020

رگرسیون چندگانه

SSE: تغییرات جمله خطا که توسط رگرسیون توضیح داده نمی‌شود.
SST: کل تغییرات در مقدار متغیر وابسته.
با این حال اغلب ترجیح داده می‌شود که از مقیاس دیگری به نام ضریب تعیین تصحیح شده برای بررسی نیکویی برازش مدل رگرسیون چند متغیره استفاده کنند. این ضریب همان ضریب تعیین است که در آن مقادیر و با درجات آزادیشان تعدیل گردیده‌اند. این ضریب در رگرسیون چند متغیره به صورت زیر محاسبه می‌شود (پیندیک و روبینفیلد، 1370):
که در آن n تعداد مشاهدات و k تعداد متغیرهای مستقل است.
با افزودن تعداد متغیرهای مستقل به مدل رگرسیون ممکن است مقدارافزایش یابد. برای جلوگیری از این حالت و کنترل تورم از آماره تعدیل شده استفاده می‌گردد که مشکلات را برطرف می‌کند(مومنی و فعال قیومی، 1386). در واقع هدف از به کارگیری تسهیل در مقایسه نیکویی برازش چندین معادله رگرسیون است که از نظر تعداد متغیرهای مستقل توضیحی متفاوتند.
3-9-3 آزمون معنادار بودن در الگوی رگرسیون
در رگرسیون چندگانه دو یا چند متغیر مستقل وجود دارد و لازم است که برای مشخص شدن معنادار بودن آنها دو آزمون انجام گیرد. ابتدا آزمون معنادار بودن معادله رگرسیون و در مرحله بعد آزمون معنادار بودن هر کدام از ضرایب متغیرهای مستقل در معادله.
3-9-4 آزمون معنادار بودن معادله رگرسیون
در یک معادله رگرسیون چندگانه، چنانچه هیچگونه رابطه‌ای میان متغیر وابسته و متغیرهای مستقل وجود نداشته باشد، می‌بایست تمامی ضرایب متغیرهای مستقل در معادله، مساوی صفر باشند. بدین ترتیب ما می‌توانیم معنادار بودن معادله رگرسیون را آزمون کنیم. این کار با استفاده از آماره F با فرض‌های زیر صورت می‌گیرد:
معادله رگرسیون معنادار نیست
معادله رگرسیون معنادار است
چنانچه در سطح اطمینان 95% (خطای 5%= ) آماره F محاسبه شده از معادله رگرسیون کوچکتر از مقدار F بدست آمده از جدول باشد فرض را نمیتوان رد کرد و در غیر اینصورترد می‌شود. واضح است که در صورت رد شدن، معادله رگرسیون معنادار خواهد بود.
3-9-4 آزمون معنادار بودن ضرایب
بعد از آزمون معنادار بودن رگرسیون، بایستی معنادار بودن هر کدام از ضرایب آزمون گردد. هدف از انجام این آزمون آن است که مشخص شود آیا در سطح اطمینان مورد نظر ضریب محاسبه شده مخالف صفر است یا خیر؟ فرضهای این آزمون به شرح زیر است:
ضریب جامعه صفر است
ضریب جامعه مخالف صفر است.
برای آزمون این فرضیات از آماره t استفاده می‌شود. اگر در سطح اطمینان 95% (خطای 5%=) آماره بدست آمده از آزمون کوچکتر از t بدست آمده از جدول با همان درجه آزادی باشد، فرض تایید شده و در غیر این صورت رد می‌شود. در این آزمون عدم رد به مفهوم بی معنا بودن ضریب مورد نظر و رد به معنی معنا دار بودن ضریب مورد نظر است.
در انجام این تحقیق از رگرسیون برگشتی نیز استفاده می‌شود. در این روش متغیرهایی در الگو باقی میمانند که بیشترین تاثیر را بر روی متغیر وابسته داشته باشند تا مقدار را به حداکثر برسانند و یا معادل آن مقدار مجموع مربعات اشتباهات (ESS) را به حداقل برسانند. در این روش ضریب همبستگی جزیی میان متغیرهای مستقل و وابسته اندازهگیری می‌شود. همبستگی جزیی بین هر یک از متغیرهای مستقل و متغیر وابسته در تعیین آنکه آیا متغیر باید به الگو افزوده شود یا خیر کاربرد دارد، زیرا همبستگی جزیی نشان می‌دهد که آیا متغیر مورد بررسی، بعد از آنکه اثرات تمامی متغیرهای دیگر الگو تعدیل شود، روی متغیر تابع مؤثر است یا خیر (پیندیک و رابنفیلد، 1370).
3-9-5 عدم خود همبستگی
با توجه به این که در مدلهای رگرسیون فرض بر آن است که جملات خطا () از دوره‌ای به دوره بعد مستقل می‌باشند، اما در بسیاری موارد، جملات خطا در دوره‌های مختلف همبسته‌اند. در چنین مواردی جملات خطا اصطلاحاً دارای خود همبستگی یا همبستگی متوالی هستند. خود همبستگی جملات خطا معمولا در مطالعات سریهای زمانی مشاهده می‌شود. برخی از دلایل وجود خود همبستگی در جملات خطا عبارتند از:
متغیرهای توضیحی حذف شده. در چنین حالتی، از آنجایی که اغلب متغیرهای اقتصادی خود همبسته می‌باشند، خطای خود همبستگی به وجود می‌آید، گنجانیدن متغیرهای توضیحی حذف شده در مدل، این مشکل را برطرف می‌نماید.
مدل بندی اشتباه یک الگو. اگر الگویی خاص را خطی فرض نماییم، در حالیکه شکل واقعی آن غیرخطی است، خطاها می‌توانند منعکس کننده برخی وابستگی‌ها باشند.
تحریف مشاهدات آماری برخی داده‌های سریهای زمانی شامل نوعی از فرایند هموار‌سازی می‌باشند که توزیع واقعی داده‌ها در خلال دوره‌های مورد بررسی را به صورت میانگین متحرک درآورده و برای مثال آثار فصلی آن را در یک سری زمانی از بین می‌برند. در نتیجه برای چنین متغیری، مقادیر می‌توانند با یکدیگر همبستگی پیدا کنند.

نوشته ای دیگر :   مدیریت زنجیره تامین