روش حداقل مربعات و ضرایب رگرسیونی

دانلود پایان نامه

فروش / سود ناخالص = سود ناخالص به فروش خالص
3ـ7ـ روش تجزیه و تحلیل اطلاعات (آزمون فرضیه ها):
به منظور بررسی صحت تفکیک دو نمونه شرکت ورشکسته و غیر ورشکسته بر اساس ماده 141 قانون تجارت، از آزمون F برای مقایسه میانگین متغیرهای مستقل الگوها در دو نمونه ورشکسته و غیرورشکسته استفاده می کنیم. فرضیات مطرح شده برای آزمون یاد شده به صورت زیر است:
H0: M1=M2
H1: M1≠M2
در این آزمون ادعا شده است که میانگین متغیرهای مستقل الگوها در دو نمونه ورشکسته و غیر ورشکسته تفکیک شده به وسیله ماده 141 با هم برابر نیستند.
برای بررسی صحت تفکیک دو نمونه ورشکسته و غیر ورشکسته که به وسیله پیش فرض انجام شده، ابتدا به بررسی دو گروه از نظر متغیرهای مستقل الگوی تحقیق می پردازیم. در این آزمون، این موضوع بررسی می گردد که آیا میانگین مقادیر متغیرهای مستقل الگو((X1-X2-X3-… در سال های 86 تا 89 در دو نمونه ورشکسته و غیر ورشکسته با یکدیگر برابرند؟ این بررسی به جهت آزمون دونمونه متفاوت بر اساس معیار پیش فرض انجام خواهد شد. به عبارت دیگر بررسی می شود که آیا تفکیک دو نمونه به وسیله پیش فرض از لحاظ آماری هم تأیید می شود؟
3ـ7ـ1ـ برازش الگو با استفاده از روش رگرسیون لجستیک
در بررسی الگوها با استفاده از رگرسیون لجستیک، ورشکستگی به عنوان متغیر وابسته تعریف می شود که دو گروه شرکت ورشکسته و غیر ورشکسته به ترتیب با 0 و 1 در نظر گرفته می شوند. روش انجام رگرسیون لجستیک به سه روش اینتر، پیش رونده و پس رونده و بک وارد است. در روش اینتر تمامی متغیرهای مستقل به طور همزمان وارد رگرسیون می شوند. در روش پیش رونده گزینش متغیرها به صورت مرحله ای با افزایش متغیرها در هر مرحله است و در ابتدا متغیری که بیشترین مقدار آماره F را دارد، وارد رگرسیون می شود. در روش پس رونده گزینش متغیرها به صورت مرحله ای با کاهش متغیرها در هر مرحله است و ضرایب رگرسیونی برآورد می شود.
آزمون معنی دار بودن همبستگی برای گزینش الگوی مناسب
یکی از شرط های لازم برای دقت نتایج به دست آمده با روش رگرسیون لجستیک، فقدان همبستگی میان متغیرهای مستقل الگوهاست. بنابراین برای گزینش روش صحیح، نیاز به آزمون همبستگی میان متغیرهای مستقل الگوهاست.
نحوه محاسبه ضرایب متغیر های مستقل در رگرسیون لجستیک
هر چند در رگرسیون لجستیک ضرایب متغیرهای مستقل مانند رگرسیون چند متغیره برآورد می شود ، لیکن نحوه برآورد آن کاملاً متفاوت است . در رگرسیون چند متغیره از روش حداقل مربعات استفاده می شود . در این روش مجموع مجذور اختلاف بین مقادیر واقعی و مقادیر پیش بینی شده متغیر وابسته حداقل می گردد . در رگرسیون لجستیک بدلیل طبیعت غیرخطی تبدیل لجستیک از روش دیگری که حداکثر درستنمایی نام دارد ، استفاده می شود .
با این حال روش برآورد ضرایب هنوز از بسیاری جهات شبیه رگرسیون معمولی است . البته لازم است که در رگرسیون لجستیک نیز در صورتی که نسبت شانس قابل محاسبه باشد ، می توان از روش حداقل مربعات استفاده نمود ، اما در سایر موارد می توان ضرایب مدل لاجیت را به روش عمومی حداکثر درستنمایی برآورد نمود . ( عرب مازار 1366)
همانطور که ذکر شد در رگرسیون لجستیک متغیر وابسته یک متغیر دو حالته (0 و 1) است که مقدار صفر و یک را به خود اختصاص می دهد . اگر فرض کنیم که Y متغیر تصادفی باشد که می تواند مقادیر صفر و یک را اختیار نماید در این صورت احتمال وقوع Y را می توانیم به شکل رابطه زیر در نظر بگیریم :

این مطلب مشابه را هم بخوانید :   تغییرات اجتماعی و از خود بیگانگی

که در آن بردار سطری ضرایب و x بردار ستونی متغیر های مستقل است . روابط فوق را می توان به صورت زیر در نظر گرفت :

رابطه فوق، رابطه خطی بین متغیرهای مستقل و لگاریتم نپرین نسبت بخت را نشان می دهد . چون معمولاً نمی توان نسبت بخت و به تبع آن لگاریتم آنرا بطور مستقیم محاسبه نمود لذا ضریب مورد نظر از روش حداکثر درستنمایی قابل برآورد خواهد بود. بر این اساس اگر هر مشاهده را یک آزمون برنولی فرض نمائیم که در این صورت برای مشاهده ام رابطه زیر را خواهیم داشت:

که در آن احتمال وقوع پیشامد مورد نظر در مشاهده ام و نیز مقادیر متغیر تصادفی است که می تواند برحسب مورد صفر ویا یک باشد (یک برای وقوع و صفر برای عدم وقوع پیشامد ) .
با فرض اینکه مشاهده مستقل باشد در این صورت تابع درستنمایی به شرح رابطه زیر خواهد بود :

حال با جایگذاری از رابطه صفحه قبل در این رابطه به رابطه زیرمی رسیم:

با گرفتن لگاریتم طبیعی از رابطه فوق خواهیم داشت :