آزمون علامت
- 12 دی, 1400
- SPSS, روش تحقیق علوم رفتاری
آزمون علامت
آزمون علامت
آزمون علامت، متعلق به گروه روشهای استنباط آماری ناپارامتری است و برای تشخیص اختلاف بین زوج مشاهدات مناسب است. برای مثال میتوان وضعیت تغییر وزن افراد را براساس این آزمون مورد تجزیه و تحلیل قرار داد. به این ترتیب آماره آزمون علامت براساس افزایش، کاهش یا ثابت بودن وزن افراد محاسبه میشود. فرض کنید وزن افراد قبل از انجام رژیم درمانی در متغیر X ثبت شده است. وزن همین اشخاص بعد از انجام رژیم درمانی نیز در متغیر Y نگهداری میشود. به این ترتیب زوج مرتب (Xi,Yi) بیانگر یک مشاهده از نمونه تصادفی است. آماره آزمون در این حالت براساس روابط x>y,x=y,x<y شکل میگیرد. هر یک از این حالتها را میتوان با نماد «–»، «+» یا «۰» نشان داد.
به بیان دیگر اگر متغیرهای Xو Y عددی و از نوع پیوسته باشند، میتوان آزمون علامت را به صورت یک فرض آماری در نظر گرفت که نشان میدهد مقدار میانه اختلاف مربوط به این دو متغیر برابر با صفر است یا خیر. از طرفی از این آزمون برای قضاوت در مورد میانه یک نمونه تصادفی نیز میتوان استفاده کرد. به این ترتیب میتوانیم تصمیم بگیریم که آیا میانه اعداد با مقدار مشخصی برابر است یا خیر. برای مثال میتوانیم برای تعیین اینکه آیا میانه نمرات یک کلاس برابر با ۱۷ است با نمونههای تصادفی آزمون فرض را اجرا کنیم.
نکته: همانطور که گفته شد، آماره آزمون علامت براساس روابط بزرگتر یا کوچکتر و یا مساوی شکل میگیرد. ولی اگر رابطه بین زوج مشاهدات را بتوان به صورت عددی (مانند آزمون T) نشان داد دقت و توان آزمون بیشتر از توان آزمون علامت خواهد بود.
آزمون علامت از گروه آزمونهای ناپارامتری محسوب میشود در نتیجه احتیاج به اطلاعاتی در مورد توزیع دادههای مربوط به جامعه آماری، ندارد. به این ترتیب نیازی به نرمال بودن توزیع دادهها برای انجام چنین آزمونی وجود ندارد. به همین علت در بسیاری از موارد قابل استفاده بوده ولی متاسفانه توان آزمون نسبت به دیگر آزمونهای مشابه کوچکتر است. از طرفی از این آزمون برای انجام آزمونهای یک طرفه و دو طرفه نیز میتوان استفاده کرد.
آزمون علامت (Sign test) یک آزمون آماری غیرپارامتریک است که برای مقایسه دو نمونه وابسته به کار میرود. این آزمون بر اساس تعداد علامتهای مثبت و منفی در دو نمونه، به صورت نسبت مقایسه میکند.
در آزمون علامت، فرض صفر این است که دو نمونه وابسته از یک توزیع یکسان تبعیت میکنند و تفاوتی آماری معنادار بین دو نمونه وجود ندارد. در صورت رد فرض صفر، میتوان نتیجه گرفت که تفاوت معناداری بین دو نمونه وجود دارد.
برای انجام آزمون علامت، ابتدا باید دادههای هر دو نمونه را مرتب کرده و سپس تعداد علامتهای مثبت و منفی را محاسبه کنیم. سپس با استفاده از جدول جداول آزمون علامت، مقدار p-value محاسبه میشود. اگر مقدار p-value کمتر از سطح اهمیت مشخص شده (معمولاً 0.05) باشد، میتوان نتیجه گرفت که تفاوت معناداری بین دو نمونه وجود دارد.
مزیت استفاده از آزمون علامت این است که به مقایسه نمونههایی که توزیع آنها نرمال نیست و همچنین به مقایسه دادههای دستهای و ترتیبی مناسب است. همچنین، این آزمون مقاوم در برابر انحرافات و پرتیها است. با این حال، محدودیتهایی هم دارد و برای تحلیل دادههای چندگانه مناسب نیست.
جهت دانلود آموزش آزمون ها spss کلیک کنید .
تاریخچه
جان آربوتنات» (John Arbuthnot) در سال ۱۷۱۰ به بررسی تعداد تولدها در شهر لندن از تاریخ 1629 تا 1710 پرداخت. در این دوره به نظر میرسید که تعداد پسرهای متولد شده از دختران بیشتر است. او در مقالهای که در آن دوره به چاپ رساند اولین بار واژه «آزمون بامعنایی» (Significance Tests) را به کار برد.
در سالهای 1710 تا ۱۷۱۳ «نیکولاس برنولی» (Nicholas Bernoulli) تحلیلها و نتایج آماری او را بررسی کرده و نتیجه گرفت که بیشتر تغییرات موالید در سال مربوط به تولد پسران است که بوسیله توزیع دو جملهای با پارامتر احتمال p=1835 توصیف میشود. به نظر میرسد اولین بار در بررسیهای «برنولی» است که از توزیع دوجملهای برای برازش دادههای واقعی استفاده شده است. در سال ۱۹۹۹ «کونور» (Conover) و «اسپرنت» (Sprent) به توصیف دستآوردهای «آربوتنات» علاقمند شدند و سعی کردند به زبان و بیان آزمون فرض آماری نظریه او را که نشان میداد نرخ تولد پسران با دختران یکسان نیست، مورد بررسی قرار دهند.
نحوه محاسبه آماره آزمون علامت
به منظور استفاده از آزمون علامت باید زوجهای نمونه، تصادفی باشند. به این معنی که هر یک از مولفههای تشکیل دهنده زوج مرتب (X,Y)
باید به صورت تصادفی از جامعه گرفته شده باشند و از طرفی با یکدیگر مرتبط باشند تا مفهوم زوج وجود داشته باشد.
فرض کنید p=P(Y>X) باشد و فرض صفر نیز به صورت H0:p=0.5 در نظر گرفته شود. به این ترتیب به نظر میرسد که فرض صفر بیانگر آن است که برای زوج مشاهده xi و yi پیشامد بزرگتر بودن مولفه اول از دومی در بیشتر موارد وجود دارد. در نظر بگیرید که یک نمونه n تایی از زوج مشاهدات به صورت {(x1,y1),(x2,y2),⋯,(xn,yn)} باشند. از این مجموعه، زوجهایی که با یکدیگر یکسان هستند را خارج میکنیم. در نتیجه ممکن است تعداد زوجهای نمونه تصادفی به m تا کاهش پیدا کند. در این حالت اگر W را تعداد زوجهایی در نظر بگیریم که در آنها yi−xi>0 با توجه به فرض صفر، توزیع W دوجملهای با پارامتر m و 0.5 است.
W=m∑i=1Iyi−xi∼B(m,0.5) واضح است که در اینجا منظور از I تابع نشانگر است، به این معنی که اگر yi−xi مثبت باشد، مقدار آن ۱ و اگر yi−xi منفی باشد مقدار آن ۰ است. به نظر میرسد که به این ترتیب الگو موفقیت و شکست مربوط به آزمایش برنولی ایجاد شده و جمع آنها از توزیع دو جمله ای پیروی میکند.
نکته: زمانی که مقدار xi یا yi برابر باشد، میگوییم به اصطلاح گره اتفاق افتاده است. در آزمون علامت، نمونههایی که گرهدار هستند حذف شده و از مابقی نمونه برای انجام آزمون استفاده میشود. به این ترتیب با توجه به توزیع دوجملهای برای W میتوان از آزمون دوجملهای نیز برای این حالت استفاده کرد. البته همانطور که میدانید برای زمانی که m>30 باشد میتوان از تقریب توزیع نرمال برای توزیع دوجملهای هم بهره گرفت.
آزمون یک طرفه H1:p<0.5 را میتوان به کمک مقدار احتمال P(W≥w) انجام داد. به این ترتیب مشخص میشود که مقدارهای X دارای رتبه بزرگتری نسبت به مقدارهای Y هستند. به همین ترتیب برای آزمون یک طرفه H1:p>0.5 نیز کافی است که مقدار احتمال را برمبنای P(W≤w′) در نظر گرفت و نشان داد که مقدارهای Y دارای مرتبه بزرگتری نسبت به X هستند. در حالتی که آزمون دو طرفه باشد، مقدار احتمال نیز برابر با «دو برابر کوچکترین مقدار احتمال مربوط به آزمونهای یک طرفه» خواهد بود.
جهت دانلود آموزش آزمون ها spss کلیک کنید .
مثال 1
به منظور بررسی تناسب پاهای چپ نوعی گوزن اطلاعاتی از طول پای چپ عقب و جلو ۱۰ گوزن ثبت شده است. میخواهیم آزمون کنیم که آیا این طولها با یکدیگر از لحاظ آماری اختلاف معنیداری دارند یا خیر. این اطلاعات مطابق جدول ثبت شدهاند.
شماره نمونه | طول پای چپ-جلو | طول پای چپ-عقب | اختلاف |
1 | 142 | 138 | + |
2 | 140 | 136 | + |
3 | 144 | 147 | – |
4 | 144 | 139 | + |
5 | 142 | 143 | – |
6 | 146 | 141 | + |
7 | 149 | 143 | + |
8 | 150 | 145 | + |
9 | 142 | 136 | + |
10 | 148 | 146 | + |
در اینجا فرض صفر، به صورت یکسان بودن طول پاهای جلویی و عقبی در نظر گرفته شده است. در فرض مقابل نیز وجود اختلاف در طول پاها لحاظ شده در نتیجه آزمون به صورت دو طرفه خواهد بود. بنابراین باید آماره آزمون W یا خیلی بزرگ (بزرگتر یا مساوی ۸) یا خیلی کوچک (کمتر از ۲) باشد تا فرض صفر رد شود.
واضح است که n=m=10 به این معنی که هیچ زوجی دارای مقدار برابر در X و Y نیستند. تعداد علامتهای مثبت (+) 8 و تعداد علامتهای منفی (-) نیز 2 است. اگر فرض صفر صحیح باشد، با توجه به توزیع دو جملهای برای اختلافها با پارامترهای 10 و 0.5 انتظار میرود که 5 علامت (+) وجود داشته باشد. به این ترتیب باید مقدارهای زیر را محاسبه کنیم.
P(W≥8|p=0.5)+P(W≤2|p=0.5)=P(W=8|p=0.5)+P(W=9|p=0.5)+P(W=10|p=0.5)+P(W=0|p=0.5)+P(W=1|p=0.5)+P(W=2|p=0.5)=0.04395+0.0077+0.00098+0.00098+0.00977+0.04395=0.109375
بنابراین با توجه به سطح آزمون ۵٪ (0.05) این نمونه، دلیل بر رد فرض صفر (یکسان بودن طول پاها) ارائه نمیدهد.
مثال ۲
در یک فروشگاه دو محصول A و B وجود دارند. فروشنده میخواهد بسنجد که تمایل مشتریان به کدام محصول بیشتر است. از ده خریدار درخواست میکند که نظر خود را در مورد ترجیح خرید از بین دو محصول A و B اعلام کنند. در اینجا فرض صفر یکسان بودن احتمال انتخاب هر یک از محصولات است، در حالیکه میتوانیم فرض مقابل را ترجیح محصول B بر A در نظر بگیریم. بنابراین اگر p را احتمال انتخاب محصول B بر A در نظر بگیریم، خواهیم داشت.
H0:p=0.5H1:p>0.5
براساس مشاهدات و نظرسنجی از این نمونه ۱۰ تایی از مشتریان، اطلاعات زیر بدست آمده است:
تعداد علامتهای + = ۸ (این به معنی ترجیح محصول B بر محصول A توسط ۸ نفر است.)
تعداد علامتهایی – = 1 (این به معنی ترجیح محصول A بر محصول B توسط ۱ نفر است.)
تعداد گرهها = ۱ (این به معنی عدم ترجیح یکی بر دیگری توسط ۱ نفر است.)
از آنجایی که تعدا گرهها باید از تعداد مشاهدات کم شود، در اینجا m=9 در نظر گرفته میشود. احتمال اینکه تعداد مثبتها زیاد (بزرگتر از ۸ باشد) چقدر است؟ اگر فرض صفر صحیح باشد، خواهیم داشت:
P(W≥8|p=0.5)=P(W=8|p=0.5)+P(W=9|p=0.5)=0.0176+0.002=0.0195
با توجه به در نظر گرفتن سطح آزمون α=0.05 فرض صفر رد میشود. بنابراین به نظر میرسد که محصول B نسبت به A دارای تمایل یا ترجیح بیشتری در بین مشتریان است.
مثال ۳
طول عمر بیمارانی که دچار سرطان هستند مورد بررسی قرار گرفته است. از بین پروندههای این بیماران ۱۰ نمونه تصادفی انتخاب شده و طول هفتههایی که از زمان مثبت بودن آزمایش تا مرگشان طی شده استخراج شده است. یک نفر نیز با توجه به این که مقدار +۳۶۲ برایش ثبت شده تایید شده که تا پایان دوره بررسیها زنده مانده است. اطلاعات به صورت زیر ثبت و مورد بررسی قرار گرفتهاند.
49,58,75,110,112,132,151,276,281,362+
قرار است با توجه به این دادهها، قضاوت کنیم که میانه طول عمر این گونه بیماران بیشتر یا کمتر از ۲۰۰ هفته است. به این ترتیب به نظر میرسد که فرض صفر و فرض مقابل به صورت زیر نوشته میشوند.
{H0:Median=200H1:Median≠200
با توجه به خصوصیات آزمون علامت مشخص است که افرادی که بیش از ۲۰۰ هفته عمر کردهاند با علامت + و کسانی که کمتر از ۲۰۰ هفته زندگی کردهاند نیز با علامت – متمایز میشوند. این کار درست به مانند روشی است که برای سنجش میزان اختلاف بین زوجها به کار بردیم. اگر فرض صفر صحیح باشد، نیمی از بیماران باید طول عمری بیشتر از ۲۰۰ یا کمتر از آن داشته باشند.
براساس دادههای جمعآوری شده تعداد علامتهای (+) برابر با ۷ و تعداد علامتهای (-) نیز ۳ است. تعداد مثبتها (+) با در نظر گرفتن صحیح بودن فرض صفر دارای توزیع دوجملهای با پارامترهای n=10 و p=0.5 است. بنابراین مقدار احتمال مشاهده بیش از ۷ یا کمتر از ۳ بیمار معیار انجام آزمون است.
احتمالات مربوطه برای هر مقدار از تعداد بیماران با توجه به توزیع دو جملهای با پارامتر n=10 و p=0.5 در جدول زیر آمده است.
k | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Pr | 0.0010 | 0.0098 | 0.0439 | 0.1172 | 0.2051 | 0.2461 | 0.2051 | 0.1172 | 0.0439 | 0.0098 | 0.0010 |
به این ترتیب احتمال مورد نظر باید از نقاط 0,1,2,3,7,8,9,10 تشکیل شود. بنابراین مجموع احتمالات برای این نقاط برابر است با:
0.0010+0.0098+0.0439+0.1172+0.1172+0.0439+0.0098+0.0010=0.3438
که اگر آزمون را در سطح 0.05 در نظر بگیریم، این نمونه دلیلی برای رد فرض صفر ندارد. در نتیجه به نظر میرسد که میانه طول عمر این بیماران برابر با ۲۰۰ هفته خواهد بود. البته ممکن است با توجه به افزایش حجم نمونه بتوان آزمون پرتوانتری داشت و به نتیجه بهتر و دقیقتری رسید.
جهت دانلود آموزش آزمون ها spss کلیک کنید .
جهت مشاهده جدید ترین آموزش های ویدویی در spss کلیک کنید .
جهت دانلود فصل چهارم پایان نامه همراه با دیتا در چهار نرم افزار Pls , Lisrel , Amos , Spss کلیک کنید .
جهت دانلود پروژه و دیتا همراه با تحلیل در spss کلیک کنید .
منبع: https://blog.faradars.org
روش تحقیق در علوم رفتاری
آزمون علامت