خانه وبلاگ روش تحقیق علوم رفتاری آمار ناپارامتری و روش‌های تجزیه و تحلیل مرتبط

آمار ناپارامتری و روش‌های تجزیه و تحلیل مرتبط

آمار ناپارامتری و روش‌های تجزیه

آمار ناپارامتری

 

آمار ناپارامتری و روش‌های تجزیه

اگر توزیع جامعه آماری نامشخص باشد و از طرفی حجم نمونه نیز کوچک باشد بطوری که نتوان ازقضیه حد مرکزی برای تعیین توزیع حدی یا مجانبی جامعه آماری، استفاده کرد، از تحلیل‌های ناپارامتری(آمار ناپارامتری) استفاده می‌شود، زیرا در این حالت کارآمدتر از روش‌های پارامتری هستند. به این ترتیب در زمانی که توزیع جامعه مشخص نباشد و یا حجم نمونه کم باشد، روش‌ها و آزمون‌های ناپارامتری نسبت به روش‌ها و آزمون‌های پارامتری از توان آزمون بیشتری برخوردارند و نسبت به آن‌ها ارجح هستند.

آمار ناپارامتریک شاخه‌ای از آمار است که داده‌های قابل اندازه‌گیری را در مقیاس اسمی یا ترتیبی مطالعه می‌کند که عملگرهای حسابی را نمی‌توان مستقیماً به آن اعمال کرد.


آمار ناپارامتریک چیست؟

آمار ناپارامتریک به روشی آماری اشاره دارد که در آن داده‌ها از مدل‌های تجویز شده‌ای که با تعداد کمی از پارامترها تعیین می‌شوند، به دست نمی‌آیند. نمونه هایی از این مدل ها شامل مدل توزیع نرمال و مدل رگرسیون خطی است. آمار ناپارامتری گاهی اوقات از داده‌هایی استفاده می‌کند که ترتیبی هستند، به این معنی که بر اعداد متکی نیست، بلکه به رتبه‌بندی یا ترتیبی از انواع متکی است. به عنوان مثال، یک نظرسنجی که ترجیحات مصرف کننده را از دوست داشتن تا دوست نداشتن منتقل می کند، داده های ترتیبی در نظر گرفته می شود.

آمار ناپارامتریک شامل آمار توصیفی ناپارامتریک، مدل های آماری، استنتاج و آزمون های آماری است. ساختار مدل مدل‌های ناپارامتریک به صورت پیشینی مشخص نشده است، بلکه از داده‌ها تعیین می‌شود. منظور از اصطلاح ناپارامتریک این نیست که چنین مدل‌هایی کاملاً فاقد پارامتر هستند، بلکه به این معناست که تعداد و ماهیت پارامترها انعطاف‌پذیر هستند و از قبل ثابت نیستند. هیستوگرام نمونه ای از تخمین ناپارامتری یک توزیع احتمال است.

جهت دانلود پکیج های آمار ناپارامتری در spss  کلیک کنید .

 

بهتر است شرایط بهره‌گیری از روش‌های ناپارامتری را به صورت زیر لیست کنیم:

برای داده‌ها، نتوان توزیع آماری مناسبی در نظر گرفت.

وجود داده‌های پرت (Outlier)، وجود چند نما و … امکان انتخاب توزیع نرمال را برایشان میسر نمی‌کند.

کم بودن حجم نمونه برآورد پارامترهای توزیع نرمال مانند میانگین و بخصوص واریانس را دچار مشکل می‌کند و در عمل امکان بررسی توزیع نرمال به علت حجم کم نمونه برای جامعه وجود ندارد.

روش‌های ناپارامتری در چنین موقعیت‌های می‌تواند راهگشا باشد و به محقق و «تحلیل‌گر داده‌» (Data Scientist) برای شناخت داده‌ها یاری برساند.

نکته: باید توجه داشت که اگر توزیع جامعه آماری قابل تحقیق و تعیین باشد، اجرای روش‌های پارامتری بر روش‌های ناپارامتری ارجح هستند زیرا در این حالت روش‌های پارامتری نسبت به روش‌های ناپارامتری از دقت بیشتری برخوردارند. بنابراین فقط زمانی که از توزیع جامعه آماری مطلع نیستم، به اجبار از روش‌های ناپارامتری استفاده خواهیم کرد. البته اگر حجم نمونه بزرگ باشد، در اکثر موارد، نتایج حاصل از آزمون‌های پارامتری و ناپارامتری با یکدیگر همخوانی دارند.

از آنجایی که در بیشتر روش‌های ناپارامتری به جای داده‌ها، ترتیب آن‌ها به کار گرفته می‌شود، بهتر است با مفهوم رتبه‌ (Rank) بیشتر آشنا شویم. در ادامه به معرفی رتبه و کاربردهای آن در آمار ناپارامتری می‌پردازیم.

 

اقلام کلیدی

استفاده از آمارهای ناپارامتریک آسان است اما دقت دقیق مدل های آماری دیگر را ارائه نمی دهد. این نوع تجزیه و تحلیل اغلب هنگام در نظر گرفتن ترتیب چیزی مناسب است، جایی که حتی اگر داده های عددی تغییر کنند، نتایج احتمالاً ثابت خواهند ماند.


آشنایی با آمار ناپارامتریک

در آمار، آمار پارامتریک شامل پارامترهایی مانند میانگین، انحراف معیار، همبستگی پیرسون، واریانس و غیره است که این شکل از آمار از داده های مشاهده شده برای تخمین پارامترهای توزیع استفاده می کند. تحت آمار پارامتری، داده ها اغلب از یک توزیع نرمال با پارامترهای ناشناخته μ (میانگین جمعیت) و σ2 (واریانس جمعیت) به دست می آیند، که سپس با استفاده از میانگین نمونه و واریانس نمونه تخمین زده می شوند.

آمار ناپارامتریک هیچ فرضی در مورد حجم نمونه یا کمی بودن داده های مشاهده شده ندارد. آمار ناپارامتریک فرض نمی کند که داده ها از یک توزیع نرمال گرفته شده اند. در عوض، شکل توزیع تحت این شکل از اندازه‌گیری آماری تخمین زده می‌شود. در حالی که موقعیت های زیادی وجود دارد که در آن می توان توزیع نرمال را فرض کرد، سناریوهایی نیز وجود دارد که در آنها فرآیند تولید داده واقعی از توزیع معمولی فاصله زیادی دارد.

ملاحظات خاص

آمارهای ناپارامتریک به دلیل سهولت استفاده از آنها مورد توجه قرار گرفته است. با برطرف شدن نیاز به پارامترها، داده ها برای انواع تست ها بیشتر قابل استفاده می شوند. این نوع آمار را می توان بدون میانگین، حجم نمونه، انحراف معیار یا تخمین پارامترهای مرتبط دیگر زمانی که هیچ یک از آن اطلاعات در دسترس نباشد، استفاده کرد.

از آنجایی که آمار ناپارامتریک مفروضات کمتری را در مورد داده های نمونه ایجاد می کند، کاربرد آن نسبت به آمار پارامتریک دامنه وسیع تری دارد. در مواردی که آزمون پارامتریک مناسب تر است، روش های ناپارامتریک کارایی کمتری خواهند داشت. این به این دلیل است که آمار ناپارامتریک بر خلاف آمار پارامتریک، برخی از اطلاعات موجود در داده ها را دور می اندازد.

آزمون های ناپارامتریک آماری
آمار ناپارامتری و روش‌های تجزیه و تحلیل مرتبط

داده‌های رتبه‌بندی شده (Ranked Data)

استفاده از رتبه‌ها به جای مقدارها، یکی از ویژگی‌های روش‌های ناپارامتری است. برای مثال همانطور که دیده‌اید ضریب همبستگی اسپیرمن یک روش ناپارامتری برای اندازه‌گیری همبستگی بین مقدارها است. برای محاسبه ضریب همبستگی پیرسون به جای استفاده از مقدارها، رتبه‌هایشان ملاک قرار می‌گیرد و ضریب همبستگی عادی (پیرسون) به جای مقدارها از روی رتبه‌ها محاسبه می‌شود.

برای ایجاد رتبه‌ها کافی است که آن‌ها را به ترتیب چیده و از کمترین تا بیشترین مقدار، برچسب‌های از ۱ تا N را نسبت دهیم. این برچسب‌ها «رتبه‌» (Rank) را نشان می‌دهد.

نکته: در روش‌های Min, Max و Average، رتبه برای داده‌های تکراری، یکسان خواهد بود ولی در روش Random و First هر مشاهده رتبه منحصر به فردی خواهد داشت.

 

انواع روش‌های آزمون‌های ناپارامتری

روش‌های آزمون فرض آمار ناپارامتری که وابسته به رتبه‌ها هستند در جدول زیر معرفی شده‌اند.

مسئله نوع آزمون
آزمون تک نمونه‌ای- مقایسه میانگین با مقدار ثابت آزمون علامت (Sign test) آزمون ویلکاکسون (Wilcoxon)
آزمون دو نمونه‌ای مستقل آزمون من ویتنی (Mann-Whitney)
آزمون مقایسه میانگین چند جامعه مستقل آزمون کروسکال والیس (Kruskal-Wallis) آزمون میانه (Mood’s median test)
آنالیز واریانس دو طرفه آزمون فریدمن (Friedman test)

از آنجایی در زمان وجود چولگی زیاد در داده‌ها، «میانه» (Median) معیار مرکزی مناسب‌تری نسبت به میانگین است، در بسیاری از تحلیل‌های ناپارامتری میانه محاسبه و مقایسه می‌شود. بنابراین زمانی که میانه برآوردگر بهتری برای نقطه تمرکز جامعه آماری باشد، روش‌های ناپارامتری مفید خواهند بود.

از طرف دیگر وجود داده‌های پرت نیز باعث انحراف میانگین خواهند شد. در چنین مواقعی باز هم میانگین نمی‌توان نماینده خوبی برای مشاهدات باشد. در چنین مواقعی نیز از میانه استفاده شده و به کارگیری روش‌های ناپارامتری مفید و موثرتر از روش‌های پارامتری است.

در روش‌های ناپارامتری علاوه بر رتبه‌ها از چندک‌ها (چارک، دهک و صدک) نیز به کار گرفته می‌شوند. روش‌های «رگرسیون ناپارامتری» (Non Parametric Regression) بر چنین شاخص‌های تکیه دارند.

در نوشتارهای آینده به بررسی روش‌های آمار ناپارامتری نظیر «رگرسیون چندکی» (Quantile Regression) و همچنین «آزمون‌های فرض ناپارامتری» (Nonparametric Hypothesis Tests) خواهیم پرداخت. همچنین در آنجا برای انجام محاسبات مربوط به این گونه روش‌ها از نرم‌افزارهای آماری نظیر SPSS، Minitab و R نیز کمک خواهیم گرفت.

که به صورت رایگان در اختیار شما پژوهشگر عزیز قرار میگیرد ابتدا به سبد خرید اضافه کنید و سپس مقاله را دانلود نمایید.

 

جهت مشاهده جدید ترین آموزش های ویدویی در spss  کلیک کنید .

جهت دانلود فصل چهارم پایان نامه همراه با دیتا در چهار نرم افزار Pls ,  Lisrel , Amos , Spss کلیک کنید .

جهت دانلود پروژه و دیتا همراه با تحلیل در spss  کلیک کنید .

 

جهت دانلود آموزش های رایگان spss کلیلک کنید

 

روش تحقیق در علوم رفتاری

https://www.investopedia.com/

 

آمار ناپارامتری و روش‌های تجزیه

اشتراک گذاری:

همچنین ممکن است دوست داشته باشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *