خانه وبلاگ روش تحقیق علوم رفتاری رگرسیون چندگانه در SPSS

رگرسیون چندگانه در SPSS

رگرسیون چندگانه در SPSS

رگرسیون چندگانه در SPSS

 

رگرسیون چندگانه در SPSS

تکنیک یا روش «رگرسیون خطی چندگانه» (Multiple Linear Regression) یکی از موثر و پرکاربردترین روش‌های تحلیل چند متغیره محسوب می شود. در روش گرسیون خطی چندگانه، یک رابطه خطی بین «متغیر وابسته» (Dependent Variable) با یک یا چند «متغیر مستقل» (Independent Variable) برقرار می‌شود. البته گاهی به متغیر وابسته، «متغیر پاسخ» (Respond Variable) و به متغیرهای مستقل، «متغیرهای پیش‌گو» (Predictor Variables) نیز می‌گویند. روش رگرسیونی را «چند گانه» (Multiple Linear Regression) می‌گویند اگر چندین متغیر مستقل قابلیت پیشگویی متغیر وابسته را داشته باشند و بتوان رابطه را به صورت خطی در نظر گرفت. با توجه به کاربرد گسترده این تکنیک، در این نوشتار به بررسی یک مثال و تحلیل رگرسیون چندگانه در SPSS خواهیم پرداخت.

رگرسیون چندگانه در SPSS

همانطور که در دیگر نوشته‌های فرادرس خوانده‌اید، رگرسیون چندگانه، روشی برای توصیف مدل رابطه خطی بین متغیرهای مستقل با یک متغیر وابسته است. در حالت کلی چنین مدلی به همراه خطای تصادفی به صورت زیر نوشته می‌شود.

y=β0+β1×1+⋯+βpxp+ε

در رابطه بالا، متغیرهای x1

تا xp نقش متغیرهای مستقل را دارند. از طرفی متغیر y نیز متغیر وابسته است. در انتها نیز ε جمله خطای مدل رگرسیونی محسوب می‌شود. ضرایب β1 تا βp نیز ضرایب مدل رگرسیونی برای متغیرهای متناظر محسوب می‌شوند. البته توجه داشته باشید که منظور از β0 ، مقدار ثابت یا متوسط کارایی فرد بدون در نظر گرفتن هر یک از متغیرهای مستقل است.

 

جهت دانلود پکیج آموزشی تحلیل رگرسیون خطی و رگرسیون خطی چندگانه کلیک کنید .

 

در ادامه به بررسی مثالی خواهیم پرداخت که مربوط به ایجاد یک رابطه خطی از متغیرهای مستقل «هوش» (Intelligence) با نام iq و برچسب Outcome of IQ test، «فعالیت گروهی» (Social Support) با نام soc و برچسب Outcome of social support test و «ابتکار» (Motivation) با نام mot و برچسب Outcome of job motivation test با متغیر وابسته «کارایی شغلی» (Job Performance) با نام perf با برچسب Outcome of Job performance test است.

نکته: از آنجایی که در نرم‌افزار SPSS نتایح ظاهر شده در خروجی را براساس برچسب هر یک از متغیرها نشان می‌دهد، اسامی برچسب‌های هر یک از متغیرها را ذکر کرده‌ایم.

ایجاد و برآورد ضرایب رگرسیون در چنین مدلی، رابطه خطی بین متغیرهای مستقل و وابسته را آشکار کرده و امکان پیش‌گویی کارایی شغلی را برای افرادی که قرار است به تازگی استخدام شوند، فراهم می‌آورد. برای شروع کار ابتدا باید فایل نمونه را از اینجا دریافت کنید. این فایل با فرمت فشرده و از  نوع فایل‌های اطلاعاتی SPSS است. در تصویر زیر چند سطری از این «مجموعه داده» (Data set) دیده می‌شود.

البته مشخص است که منظور از متغیر شماره ۱ در اینجا همان کارایی شغلی است که در مدل به عنوان متغیر وابسته در نظر گرفته خواهد شد. همچنین متغیرهای ۲ و ۳ و ۴ به ترتیب مقدار هوش، ابتکار و فعالیت گروهی را برای هر کارمند مشخص می‌کنند. برای مشخص شدن خصوصیات هر یک از این متغیرها از دستور Descriptive از فهرست Analysis و گزینه Descriptive Statistics استفاده می‌کنیم. کافی است همه متغیرها را در کادر (variable(s قرار داده و دکمه Ok را بزنید.

نکته: اجرای دستورات SPSS به کمک پنجره دستورات یا Syntax نیز میسر است. به منظور دریافت آماره‌های توصیفی با استفاده از خط فرمان، مشابه پنجره Descriptive، کافی است کد زیر را در پنجره Syntax وارد و اجرا کنید.

DESCRIPTIVES VARIABLES=perf iq mot soc /STATISTICS=MEAN STDDEV MIN MAX.

1 2 DESCRIPTIVES VARIABLES=perf iq mot soc   /STATISTICS=MEAN STDDEV MIN MAX.

خروجی به صورت زیر در خواهد آمد. مشخص است که این اطلاعات مربوط به ۶۰ کارمند بوده و «حداقل» (Minimum)، «حداکثر» (Maximum)، «میانگین» (Mean) و «انحراف استاندارد» (Std. Deviation) امتیازات یا مقدارهای مربوط به هر متغیر در جدول قرار گرفته است.

به نظر می‌رسد که واحدهای اندازه‌گیری برای هر یک از این امتیازات متفاوت است. بنابراین هنگام اجرای رگرسیون باید اهمیت هر یک از متغیرها را براساس ضریب استاندارد شده آن (که در ادامه مورد بررسی قرار می‌گیرد) تعیین کرد.

 

جهت دانلود پکیج آموزشی تحلیل رگرسیون خطی و رگرسیون خطی چندگانه کلیک کنید .

 

بررسی وجود رابطه خطی بین متغیرهای مستقل و وابسته

قبل از هر تحلیل رگرسیونی، بهتر است با استفاده «نمودار پراکندگی» (Scatter Plot) و همچنین محاسبه ضریب همبستگی، وجود رابطه خطی بین هر یک از متغیرهای مستقل با متغیر وابسته مورد بررسی قرار بگیرد. به این منظور نمودارهای پراکندگی ابزار مناسبی هستند. برای رسم چنین نمواری به طریق زیر عمل می‌کنیم:

از فهرست Chart گزینه Legacy Dialog را انتخاب کرده و دستور Scatter/Dot را انتخاب می‌کنیم.

از پنجره ظاهر شده گزینه Matrix Scatter را به منظور ترسیم همزمان نمودار پراکندگی برای متغیرها به صورت ماتریسی انتخاب سپس دکمه Define را کلیک می‌کنیم.

همه متغیرهای مستقل و وابسته را در کادر Variables قرار دهید. با فشردن دکمه OK، نتیجه در پنجره Output ظاهر خواهد شد.

همانطور که در نمودارها دیده می‌شود، بین هر یک از متغیرهای مستقل با متغیر وابسته یک رابطه خطی دیده می‌شود. از طرفی رابطه خطی بین متغیرهای مستقل ضعیف دیده می‌شود. برای مثال اگر رابطه بین متغیر iq و mot را در نظر بگیریم، به نظر می‌رسد نمی‌توان رابطه خطی بینشان مشاهده کرد. این حالت زمانی که به بررسی همخطی مشغول هستیم مناسب تشخیص داده می‌شود. اگر لازم است، می‌توانید از قالب دستوری برای ترسیم این نمودارها استفاده کنید. کافی است کد زیر را در پنجره Syntax وارد و اجرا کنید.

GRAPH /SCATTERPLOT(MATRIX)=perf iq mot soc /MISSING=LISTWISE.

1 2 3 GRAPH   /SCATTERPLOT(MATRIX)=perf iq mot soc   /MISSING=LISTWISE.

حال به بررسی مقدار ضریب همبستگی پیرسون بین متغیرهای مستقل با وابسته می‌پردازیم. کافی است که از فهرست Analysis گزینه Correlation و سپس دستور Bivariate را انتخاب کنید. در کادر Variables‌ همه متغیرها را قرار داده دکمه OK را کلیک کنید.

همانطور که مشخص است شیوه محاسبه ضریب همبستگی با توجه به فرمول «ضریب همبستگی پیرسون» (Pearson) صورت گرفته و در صورتی مقدار ضریب همبستگی بین هر دو متغیر، در آزمون دو طرفه (Two-tailed) معنی‌دار باشد، با علامت * مشخص می‌شوند. خروجی به صورت زیر قابل مشاهده است. در زیرنویس مربوط به این جدول علامت *** نشانگر معنی‌دار بودن آزمون آماری (رد فرض صفر یا بی معنی بودن ضریب همبستگی) در سطح خطای 0.01 یا سطح آزمون 0.99 است.

همانطور که دیده می‌شود، رابطه بین متغیرهایی که با رنگ قرمز مشخص شده معنی دار بود ولی بین متغیرهایی که مقادیرشان در کادر آبی قرار دارد، معنی دار نیست. به این ترتیب بین متغیر وابسته (سطر اول) با همه متغیرهای دیگر رابطه خطی به خوبی برقرار است. ولی بین متغیرهای مستقل رابطه همخطی دیده نمی‌شود. پس مناسب است که به دنبال مدل خطی بین متغیرهای مستقل و وابسته بگردیم تا قادر به پیش‌گویی مقادیر جدید برای متغیر وابسته باشیم. برای اجرای و نمایش خروجی مربوط به محاسبات ضرایب همبستگی کافی است از کد زیر کمک بگیرید.

CORRELATIONS /VARIABLES=perf iq mot soc /PRINT=TWOTAIL NOSIG /MISSING=PAIRWISE.

1 2 3 4 CORRELATIONS   /VARIABLES=perf iq mot soc   /PRINT=TWOTAIL NOSIG   /MISSING=PAIRWISE.

اجرای رگرسیون چندگانه

به منظور تحلیل رگرسیون چندگانه در SPSS از فهرست Analysis‌ گزینه Regression و دستور Linear را اجرا می‌کنیم. متغیر perf را در کادر dependent و بقیه متغیرها را (به جز متغیر name) در کادر (Independent(s وارد می‌کنیم. برای انجام محاسبات و نمایش نتایج مربوط به «برآورد ضرایب» (Estimates) و «مدل برازش شده» (Model fit) در این مدل با فشردن دکمه statistics گزینه‌ها را مطابق با تصویر زیر انتخاب می‌کنیم. بررسی مربوط به وجود رابطه خطی بین متغیرهای مستقل که به همخطی معروف است به کمک انتخاب گزینه Colinearity diagnostics میسر می‌شود. توجه داشته باشید از آنجایی یکی از شرط‌های مهم در برآورد پارامترهای رگرسیون خطی به روش OLS یا رگرسیونی کمترین مربعات (Ordinary Least Square) ، نرمال بودن باقی‌مانده‌ها است. در اینجا برای آزمون تصادفی و استقلال باقی‌مانده‌ها از آزمون Durbin-Watson استفاده کرده‌ایم.

نکته: نحوه ورود متغیرها در مدل را به صورت Enter انتخاب کرده‌ایم در نتیجه برآورد پارامترهای مدل، برای همه متغیرها صورت خواهد گرفت.

اگر بخواهید این دستورات را به کمک پنجره Syntax را اجرا کنید، باید در پنجره مربوطه کد زیر را وارد و اجرا کنید.

REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA COLLIN TOL /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT perf /METHOD=ENTER iq mot soc /RESIDUALS DURBIN.

1 2 3 4 5 6 7 8 REGRESSION   /MISSING LISTWISE   /STATISTICS COEFF OUTS R ANOVA COLLIN TOL   /CRITERIA=PIN(.05) POUT(.10)   /NOORIGIN   /DEPENDENT perf   /METHOD=ENTER iq mot soc   /RESIDUALS DURBIN.

در ادامه، خروجی‌ها را به ترتیبی که در پنجره Output ظاهر خواهند شد، توضیح و تفسیر خواهیم کرد. در ابتدا جدول یا گزارشی با نام Variables Entered/Removed ظاهر شده که وظیفه معرفی متغیرهای مستقل و وابسته در مدل را به عهده دارد. از آنجایی که روش ورود متغیرها (Method) در پنجره اصلی از نوع Enter انتخاب شده بود، همه متغیرهای مستقل در مدل به منظور برآورد پارامترها، وارد شده‌اند. از آنجایی که این جدول تاثیری در تصمیمات ما نخواهد داشت، از نمایش آن در این نوشتار خودداری کرده‌ایم.

در ادامه، جدول دوم که Model Summary نام‌گذاری شده است ظاهر می‌شود. در این جدول ضریب همبستگی (R) و ضریب تعیین (R Square) و … ظاهر می‌شود.

از آنجایی که ضریب همبستگی (R=0.809) و ضریب تعیین (R Square=0.654) و همچنین «ضریب تعیین اصلاح شده» (0.363=Adjusted R Square) محاسبه شده است، به نظر می‌رسد که مدل رگرسیونی مناسب است. هر چه این مقدارها به ۱ نزدیک‌تر باشند، مدل بیانگر رابطه بیشتری بین متغیر وابسته و مستقل است. به بیان دیگر مدل رگرسیونی توانسته درصد بیشتری از تغییرات متغیر وابسته را تحت پوشش قرار داده یا بیان کند. در انتهای جدول نیز ستون Durbin-Watson آماره مربوطه را با مقدار 2.003 نشان می‌دهد. اگر مقدار این آماره نزدیک به ۲ باشد، نشان از مستقل بودن باقی‌مانده‌ها خواهد داد. به این ترتیب باز هم شرط دیگری از شروط مربوط به رگرسیون خطی (OLS) برآورده می‌شود.

در جدول بعدی با نام ANOVA، تحلیل مربوط به واریانس برای مدل رگرسیونی صورت گرفته. با توجه به بزرگ بودن F و مقدار Sig=0.000<0.05 نتیجه می‌گیریم که مدل رگرسیونی مناسب خواهد بود. زیرا بیشتر تغییرات متغیر وابسته در مدل رگرسیونی دیده شده است. به این معنی که سهم مدل (Regression) در تغییرات کل که در سطر آخر (Total) ستون (Sum of Squares) دیده می‌شود، به نسبت سهم خطا یا باقی‌مانده‌ها (Residual) بسیار بیشتر است.

نکته: از آنجایی که مقدار احتمال خطای نوع اول (Error Type I) را 0.05 در نظر گرفته‌ایم، مقدار Sig را با 0.05 مقایسه کرده‌ایم.

 

جهت دانلود پکیج آموزشی تحلیل رگرسیون خطی و رگرسیون خطی چندگانه کلیک کنید .

 

رگرسیون چندگانه در SPSS

در جدول Coefficients، برآورد ضرایب و خصوصیات مربوط به آزمون‌ آن‌ها دیده می‌شود. همانطور که در جدول زیر مشاهده می‌کنید، مقدار ثابت Constant در مدل با مقدار 18.131 ظاهر شده است. همچنین مشخص است که ضرایب هر یک از متغیرها مثبت بوده و با توجه به کوچکتر بودن مقدار Sig هر متغیر از مقدار 0.05 فرض صفر بودنشان رد می‌شود. باز هم این موضوع دلیلی بر مناسب بودن مدل رگرسیونی است. ستون Unstandardize Coefficients که ضرایب واقعی را نشان می‌دهد با توجه به واحد اندازه‌گیری هر یک از متغیرها ایجاد شده‌اند بنابراین نمی‌توان براساس بزرگی هر یک از ضرایب اهمیت متغیر مربوطه در مدل رگرسیونی را تشخیص داد. به این منظور از ستون Standardize Coefficients Beta استفاده می‌کنیم. هر ضریبی که دارای Beta بزرگتری باشد، در مدل رگرسیونی از اهمیت بیشتری نیز برخوردار است. به این ترتیب مشخص می‌شود که متغیر mot یا ابتکار (Beta = 0.522) بهترین متغیر برای پیش‌گویی متغیر وابسته است. به این ترتیب متغیرهای بعدی به ترتیب iq با مقدار (Beta =0.471) و سپس soc نیز با مقدار Beta=0.251 هستند.

با توجه به این ضرایب می‌توانیم مدل رگرسیونی را به صورت زیر نمایش دهیم. با استفاده از این رابطه، می‌توان برای کارمندان جدید، میزان کارایی را با توجه به ویژگی‌های آزمون هوش، ابتکار و فعالیت اجتماعی برآورد کرد.

perf=18.131+0.265iq+0.308mot+0.164soc

نکته: دو ستون آخر این جدول مربوط به بررسی همخطی است. همانطور که می‌دانید اگر مقدار Tolerance یا میزان تحمل از 0.1 یا VIF بزرگتر از ۱۰ باشد، مدل رگرسیونی از مشکل همخطی رنج می‌برد. در حالیکه در جدول خروجی SPSS هر دو این شاخص‌ها گواهی بر عدم وجود همخطی می‌دهند. بنابراین همانطور که در نمودارهای قبلی وجود همخطی دیده نشد، شاخص‌های VIF و Tolerance نیز تایید کننده این موضوع هستند.

در جدول «بررسی همخطی» (Collinearity Diagnostics) سهم هر یک از متغیر در هر بعد برای بیان پراکندگی متغیر پاسخ مشخص شده است. با توجه به این موضع می‌توان گفت که iq، اولین متغیر است که بیشترین سهم را در بیان تغییرات متغیر پاسخ دارد، این سهم حدود ۷3 درصد است. دومین متغیر می‌تواند soc با درصدی حدود 64 در تاثیرگذاری روی متغیرات متغیر وابسته باشد. در مرحله آخر نیز از متغیر mot می‌توان به عنوان موثر‌ترین متغیر نام برد. البته در اینجا منظور از سهم هر متغیر در تغییرات متغیر وابسته به صورت مجزا و در هر بُعد در نظر گرفته شده است. مقادیر ویژه ماتریس XTX

نیز در ستون Eigenvalue مشاهده می‌شود.

نکته: جمع هر ستون (سهم متغیر) در بیان تغییرات کل در همه ابعاد برابر با ۱ است.

در انتهای گزارش نیز جدولی به منظور بررسی توزیع باقی‌مانده‌ها درج شده. با توجه به شرایط رگرسیونی OLS، باید باقی‌مانده‌ها دارای توزیع نرمال با میانگین صفر و واریانس ۱ باشند. در جدول زیر وجود چنین شرطی مشاهده می‌شود.

در سطر دوم و آخر که مربوط به باقی‌مانده‌ها است، صفر بودن میانگین و برابر با ۱ بودن انحراف استاندارد یا واریانس مشاهده می‌شود. این مطلب هم دلیلی دیگر بر مناسب بودن مدل ایجاد شده خواهد بود.

نکته: از آنجایی که رابطه رگرسیونی بین ۳ متغیر مستقل با متغیر وابسته برقرار شده است، نمی‌توان ترسیمی برای نمایش این رابطه ارائه کرد زیرا احتیاج به فضای چهار بُعدی خواهیم داشت.

که به صورت رایگان در اختیار شما پژوهشگر عزیز قرار میگیرد ابتدا به سبد خرید اضافه کنید و سپس مقاله را دانلود نمایید.

 

 

جهت دانلود پکیج آموزشی تحلیل رگرسیون خطی و رگرسیون خطی چندگانه کلیک کنید .

جهت مشاهده جدید ترین آموزش های ویدویی در spss  کلیک کنید .

جهت دانلود فصل چهارم پایان نامه همراه با دیتا در چهار نرم افزار Pls ,  Lisrel , Amos , Spss کلیک کنید .

جهت دانلود پروژه و دیتا همراه با تحلیل در spss  کلیک کنید .

 

 

 

 

 

جهت دانلود آموزش های رایگان spss کلیلک کنید

 

 

روش تحقیق در علوم رفتاری

www.cmu.edu

 

رگرسیون چندگانه در SPSS

اشتراک گذاری:

همچنین ممکن است دوست داشته باشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *