آمار ناپارامتری و روشهای تجزیه و تحلیل مرتبط
- 8 دی, 1400
- SPSS, روش تحقیق علوم رفتاری

آمار ناپارامتری
آمار ناپارامتری و روشهای تجزیه
اگر توزیع جامعه آماری نامشخص باشد و از طرفی حجم نمونه نیز کوچک باشد بطوری که نتوان ازقضیه حد مرکزی برای تعیین توزیع حدی یا مجانبی جامعه آماری، استفاده کرد، از تحلیلهای ناپارامتری(آمار ناپارامتری) استفاده میشود، زیرا در این حالت کارآمدتر از روشهای پارامتری هستند. به این ترتیب در زمانی که توزیع جامعه مشخص نباشد و یا حجم نمونه کم باشد، روشها و آزمونهای ناپارامتری نسبت به روشها و آزمونهای پارامتری از توان آزمون بیشتری برخوردارند و نسبت به آنها ارجح هستند.
آمار ناپارامتریک شاخهای از آمار است که دادههای قابل اندازهگیری را در مقیاس اسمی یا ترتیبی مطالعه میکند که عملگرهای حسابی را نمیتوان مستقیماً به آن اعمال کرد.
آمار ناپارامتریک چیست؟
آمار ناپارامتریک به روشی آماری اشاره دارد که در آن دادهها از مدلهای تجویز شدهای که با تعداد کمی از پارامترها تعیین میشوند، به دست نمیآیند. نمونه هایی از این مدل ها شامل مدل توزیع نرمال و مدل رگرسیون خطی است. آمار ناپارامتری گاهی اوقات از دادههایی استفاده میکند که ترتیبی هستند، به این معنی که بر اعداد متکی نیست، بلکه به رتبهبندی یا ترتیبی از انواع متکی است. به عنوان مثال، یک نظرسنجی که ترجیحات مصرف کننده را از دوست داشتن تا دوست نداشتن منتقل می کند، داده های ترتیبی در نظر گرفته می شود.
آمار ناپارامتریک شامل آمار توصیفی ناپارامتریک، مدل های آماری، استنتاج و آزمون های آماری است. ساختار مدل مدلهای ناپارامتریک به صورت پیشینی مشخص نشده است، بلکه از دادهها تعیین میشود. منظور از اصطلاح ناپارامتریک این نیست که چنین مدلهایی کاملاً فاقد پارامتر هستند، بلکه به این معناست که تعداد و ماهیت پارامترها انعطافپذیر هستند و از قبل ثابت نیستند. هیستوگرام نمونه ای از تخمین ناپارامتری یک توزیع احتمال است.
جهت دانلود پکیج های آمار ناپارامتری در spss کلیک کنید .
بهتر است شرایط بهرهگیری از روشهای ناپارامتری را به صورت زیر لیست کنیم:
برای دادهها، نتوان توزیع آماری مناسبی در نظر گرفت.
وجود دادههای پرت (Outlier)، وجود چند نما و … امکان انتخاب توزیع نرمال را برایشان میسر نمیکند.
کم بودن حجم نمونه برآورد پارامترهای توزیع نرمال مانند میانگین و بخصوص واریانس را دچار مشکل میکند و در عمل امکان بررسی توزیع نرمال به علت حجم کم نمونه برای جامعه وجود ندارد.
روشهای ناپارامتری در چنین موقعیتهای میتواند راهگشا باشد و به محقق و «تحلیلگر داده» (Data Scientist) برای شناخت دادهها یاری برساند.
نکته: باید توجه داشت که اگر توزیع جامعه آماری قابل تحقیق و تعیین باشد، اجرای روشهای پارامتری بر روشهای ناپارامتری ارجح هستند زیرا در این حالت روشهای پارامتری نسبت به روشهای ناپارامتری از دقت بیشتری برخوردارند. بنابراین فقط زمانی که از توزیع جامعه آماری مطلع نیستم، به اجبار از روشهای ناپارامتری استفاده خواهیم کرد. البته اگر حجم نمونه بزرگ باشد، در اکثر موارد، نتایج حاصل از آزمونهای پارامتری و ناپارامتری با یکدیگر همخوانی دارند.
از آنجایی که در بیشتر روشهای ناپارامتری به جای دادهها، ترتیب آنها به کار گرفته میشود، بهتر است با مفهوم رتبه (Rank) بیشتر آشنا شویم. در ادامه به معرفی رتبه و کاربردهای آن در آمار ناپارامتری میپردازیم.
اقلام کلیدی
استفاده از آمارهای ناپارامتریک آسان است اما دقت دقیق مدل های آماری دیگر را ارائه نمی دهد. این نوع تجزیه و تحلیل اغلب هنگام در نظر گرفتن ترتیب چیزی مناسب است، جایی که حتی اگر داده های عددی تغییر کنند، نتایج احتمالاً ثابت خواهند ماند.
آشنایی با آمار ناپارامتریک
در آمار، آمار پارامتریک شامل پارامترهایی مانند میانگین، انحراف معیار، همبستگی پیرسون، واریانس و غیره است که این شکل از آمار از داده های مشاهده شده برای تخمین پارامترهای توزیع استفاده می کند. تحت آمار پارامتری، داده ها اغلب از یک توزیع نرمال با پارامترهای ناشناخته μ (میانگین جمعیت) و σ2 (واریانس جمعیت) به دست می آیند، که سپس با استفاده از میانگین نمونه و واریانس نمونه تخمین زده می شوند.
آمار ناپارامتریک هیچ فرضی در مورد حجم نمونه یا کمی بودن داده های مشاهده شده ندارد. آمار ناپارامتریک فرض نمی کند که داده ها از یک توزیع نرمال گرفته شده اند. در عوض، شکل توزیع تحت این شکل از اندازهگیری آماری تخمین زده میشود. در حالی که موقعیت های زیادی وجود دارد که در آن می توان توزیع نرمال را فرض کرد، سناریوهایی نیز وجود دارد که در آنها فرآیند تولید داده واقعی از توزیع معمولی فاصله زیادی دارد.
ملاحظات خاص
آمارهای ناپارامتریک به دلیل سهولت استفاده از آنها مورد توجه قرار گرفته است. با برطرف شدن نیاز به پارامترها، داده ها برای انواع تست ها بیشتر قابل استفاده می شوند. این نوع آمار را می توان بدون میانگین، حجم نمونه، انحراف معیار یا تخمین پارامترهای مرتبط دیگر زمانی که هیچ یک از آن اطلاعات در دسترس نباشد، استفاده کرد.
از آنجایی که آمار ناپارامتریک مفروضات کمتری را در مورد داده های نمونه ایجاد می کند، کاربرد آن نسبت به آمار پارامتریک دامنه وسیع تری دارد. در مواردی که آزمون پارامتریک مناسب تر است، روش های ناپارامتریک کارایی کمتری خواهند داشت. این به این دلیل است که آمار ناپارامتریک بر خلاف آمار پارامتریک، برخی از اطلاعات موجود در داده ها را دور می اندازد.


دادههای رتبهبندی شده (Ranked Data)
استفاده از رتبهها به جای مقدارها، یکی از ویژگیهای روشهای ناپارامتری است. برای مثال همانطور که دیدهاید ضریب همبستگی اسپیرمن یک روش ناپارامتری برای اندازهگیری همبستگی بین مقدارها است. برای محاسبه ضریب همبستگی پیرسون به جای استفاده از مقدارها، رتبههایشان ملاک قرار میگیرد و ضریب همبستگی عادی (پیرسون) به جای مقدارها از روی رتبهها محاسبه میشود.
برای ایجاد رتبهها کافی است که آنها را به ترتیب چیده و از کمترین تا بیشترین مقدار، برچسبهای از ۱ تا N را نسبت دهیم. این برچسبها «رتبه» (Rank) را نشان میدهد.
نکته: در روشهای Min, Max و Average، رتبه برای دادههای تکراری، یکسان خواهد بود ولی در روش Random و First هر مشاهده رتبه منحصر به فردی خواهد داشت.
انواع روشهای آزمونهای ناپارامتری
روشهای آزمون فرض آمار ناپارامتری که وابسته به رتبهها هستند در جدول زیر معرفی شدهاند.
مسئله | نوع آزمون |
آزمون تک نمونهای- مقایسه میانگین با مقدار ثابت | آزمون علامت (Sign test) آزمون ویلکاکسون (Wilcoxon) |
آزمون دو نمونهای مستقل | آزمون من ویتنی (Mann-Whitney) |
آزمون مقایسه میانگین چند جامعه مستقل | آزمون کروسکال والیس (Kruskal-Wallis) آزمون میانه (Mood’s median test) |
آنالیز واریانس دو طرفه | آزمون فریدمن (Friedman test) |
از آنجایی در زمان وجود چولگی زیاد در دادهها، «میانه» (Median) معیار مرکزی مناسبتری نسبت به میانگین است، در بسیاری از تحلیلهای ناپارامتری میانه محاسبه و مقایسه میشود. بنابراین زمانی که میانه برآوردگر بهتری برای نقطه تمرکز جامعه آماری باشد، روشهای ناپارامتری مفید خواهند بود.
از طرف دیگر وجود دادههای پرت نیز باعث انحراف میانگین خواهند شد. در چنین مواقعی باز هم میانگین نمیتوان نماینده خوبی برای مشاهدات باشد. در چنین مواقعی نیز از میانه استفاده شده و به کارگیری روشهای ناپارامتری مفید و موثرتر از روشهای پارامتری است.
در روشهای ناپارامتری علاوه بر رتبهها از چندکها (چارک، دهک و صدک) نیز به کار گرفته میشوند. روشهای «رگرسیون ناپارامتری» (Non Parametric Regression) بر چنین شاخصهای تکیه دارند.
در نوشتارهای آینده به بررسی روشهای آمار ناپارامتری نظیر «رگرسیون چندکی» (Quantile Regression) و همچنین «آزمونهای فرض ناپارامتری» (Nonparametric Hypothesis Tests) خواهیم پرداخت. همچنین در آنجا برای انجام محاسبات مربوط به این گونه روشها از نرمافزارهای آماری نظیر SPSS، Minitab و R نیز کمک خواهیم گرفت.
که به صورت رایگان در اختیار شما پژوهشگر عزیز قرار میگیرد ابتدا به سبد خرید اضافه کنید و سپس مقاله را دانلود نمایید.
جهت مشاهده جدید ترین آموزش های ویدویی در spss کلیک کنید .
جهت دانلود فصل چهارم پایان نامه همراه با دیتا در چهار نرم افزار Pls , Lisrel , Amos , Spss کلیک کنید .
جهت دانلود پروژه و دیتا همراه با تحلیل در spss کلیک کنید .
جهت دانلود آموزش های رایگان spss کلیلک کنید
روش تحقیق در علوم رفتاری
آمار ناپارامتری و روشهای تجزیه