آزمون علامت

آزمون علامت

آزمون علامت

 

آزمون علامت

آزمون علامت، متعلق به گروه روش‌های استنباط آماری ناپارامتری است و برای تشخیص اختلاف بین زوج‌ مشاهدات مناسب است. برای مثال می‌توان وضعیت تغییر وزن افراد را براساس این آزمون مورد تجزیه و تحلیل قرار داد. به این ترتیب آماره آزمون علامت براساس افزایش، کاهش یا ثابت بودن وزن افراد محاسبه می‌شود. فرض کنید وزن افراد قبل از انجام رژیم درمانی در متغیر X ثبت شده است. وزن همین اشخاص بعد از انجام رژیم درمانی نیز در متغیر Y نگهداری می‌شود. به این ترتیب زوج مرتب (Xi,Yi) بیانگر یک مشاهده از نمونه تصادفی است. آماره آزمون در این حالت براساس روابط x>y,x=y,x<y شکل می‌گیرد. هر یک از این حالت‌ها را می‌توان با نماد «–»، «+» یا «۰» نشان داد.

به بیان دیگر اگر متغیرهای Xو Y عددی و از نوع پیوسته باشند، می‌توان آزمون علامت را به صورت یک فرض آماری در نظر گرفت که نشان می‌دهد مقدار میانه اختلاف مربوط به این دو متغیر برابر با صفر است یا خیر. از طرفی از این آزمون برای قضاوت در مورد میانه یک نمونه تصادفی نیز می‌توان استفاده کرد. به این ترتیب می‌توانیم تصمیم بگیریم که آیا میانه اعداد با مقدار مشخصی برابر است یا خیر. برای مثال می‌توانیم برای تعیین اینکه آیا میانه نمرات یک کلاس برابر با ۱۷ است با نمونه‌های تصادفی آزمون فرض را اجرا کنیم.

نکته: همانطور که گفته شد، آماره آزمون علامت براساس روابط بزرگتر یا کوچکتر و یا مساوی شکل می‌گیرد. ولی اگر رابطه بین زوج مشاهدات را بتوان به صورت عددی (مانند آزمون T) نشان داد دقت و توان آزمون بیشتر از توان آزمون علامت خواهد بود.

آزمون علامت از گروه آزمون‌های ناپارامتری محسوب می‌شود در نتیجه احتیاج به اطلاعاتی در مورد توزیع داده‌های مربوط به جامعه آماری، ندارد. به این ترتیب نیازی به نرمال بودن توزیع داده‌ها برای انجام چنین آزمونی وجود ندارد. به همین علت در بسیاری از موارد قابل استفاده بوده ولی متاسفانه توان آزمون نسبت به دیگر آزمون‌های مشابه کوچکتر است. از طرفی از این آزمون برای انجام آزمون‌های یک طرفه و دو طرفه نیز می‌توان استفاده کرد.

آزمون علامت (Sign test) یک آزمون آماری غیرپارامتریک است که برای مقایسه دو نمونه وابسته به کار می‌رود. این آزمون بر اساس تعداد علامت‌های مثبت و منفی در دو نمونه، به صورت نسبت مقایسه می‌کند.

در آزمون علامت، فرض صفر این است که دو نمونه وابسته از یک توزیع یکسان تبعیت می‌کنند و تفاوتی آماری معنادار بین دو نمونه وجود ندارد. در صورت رد فرض صفر، می‌توان نتیجه گرفت که تفاوت معناداری بین دو نمونه وجود دارد.

برای انجام آزمون علامت، ابتدا باید داده‌های هر دو نمونه را مرتب کرده و سپس تعداد علامت‌های مثبت و منفی را محاسبه کنیم. سپس با استفاده از جدول جداول آزمون علامت، مقدار p-value محاسبه می‌شود. اگر مقدار p-value کمتر از سطح اهمیت مشخص شده (معمولاً 0.05) باشد، می‌توان نتیجه گرفت که تفاوت معناداری بین دو نمونه وجود دارد.

مزیت استفاده از آزمون علامت این است که به مقایسه نمونه‌هایی که توزیع آن‌ها نرمال نیست و همچنین به مقایسه داده‌های دسته‌ای و ترتیبی مناسب است. همچنین، این آزمون مقاوم در برابر انحرافات و پرتی‌ها است. با این حال، محدودیت‌هایی هم دارد و برای تحلیل داده‌های چندگانه مناسب نیست.

جهت دانلود آموزش آزمون ها  spss کلیک کنید .

 

تاریخچه

جان آربوتنات» (John Arbuthnot) در سال ۱۷۱۰ به بررسی تعداد تولدها در شهر لندن از تاریخ 1629 تا 1710 پرداخت. در این دوره به نظر می‌رسید که تعداد پسرهای متولد شده از دختران بیشتر است. او در مقاله‌ای که در آن دوره به چاپ رساند اولین بار واژه «آزمون بامعنایی» (Significance Tests) را به کار برد.

در سال‌های 1710 تا ۱۷۱۳ «نیکولاس برنولی» (Nicholas Bernoulli)  تحلیل‌ها و نتایج آماری او را بررسی کرده و نتیجه گرفت که بیشتر تغییرات موالید در سال مربوط به تولد پسران است که بوسیله توزیع دو جمله‌ای با پارامتر احتمال p=1835 توصیف می‌شود. به نظر می‌رسد اولین بار در بررسی‌های «برنولی» است که از توزیع دوجمله‌ای برای برازش داده‌های واقعی استفاده شده است. در سال ۱۹۹۹ «کونور» (Conover) و «اسپرنت» (Sprent) به توصیف دست‌آوردهای «آربوتنات» علاقمند شدند و سعی کردند به زبان و بیان آزمون فرض آماری نظریه او را که نشان می‌داد نرخ تولد پسران با دختران یکسان نیست، مورد بررسی قرار دهند.

 

نحوه محاسبه آماره آزمون علامت

به منظور استفاده از آزمون علامت باید زوج‌های نمونه، تصادفی باشند. به این معنی که هر یک از مولفه‌های تشکیل دهنده زوج مرتب (X,Y)

باید به صورت تصادفی از جامعه گرفته شده باشند و از طرفی با یکدیگر مرتبط باشند تا مفهوم زوج وجود داشته باشد.

فرض کنید p=P(Y>X) باشد و فرض صفر نیز به صورت H0:p=0.5 در نظر گرفته شود. به این ترتیب به نظر می‌رسد که فرض صفر بیانگر آن است که برای زوج مشاهده xi و yi پیشامد بزرگتر بودن مولفه اول از دومی در بیشتر موارد وجود دارد. در نظر بگیرید که یک نمونه n تایی از زوج مشاهدات به صورت {(x1,y1),(x2,y2),⋯,(xn,yn)} باشند. از این مجموعه، زوج‌هایی که با یکدیگر یکسان هستند را خارج می‌کنیم. در نتیجه ممکن است تعداد زوج‌های نمونه تصادفی به m تا کاهش پیدا کند. در این حالت اگر W را تعداد زوج‌هایی در نظر بگیریم که در آن‌ها yi−xi>0 با توجه به فرض صفر،‌ توزیع W دوجمله‌ای با پارامتر m و 0.5 است.

W=m∑i=1Iyi−xi∼B(m,0.5) واضح است که در اینجا منظور از I تابع نشانگر است، به این معنی که اگر yi−xi مثبت باشد، مقدار آن ۱ و اگر yi−xi منفی باشد مقدار آن ۰ است. به نظر می‌رسد که به این ترتیب الگو موفقیت و شکست مربوط به آزمایش برنولی ایجاد شده و جمع آن‌ها از توزیع دو جمله ای پیروی می‌کند.

نکته: زمانی که مقدار xi یا yi برابر باشد، می‌گوییم به اصطلاح گره اتفاق افتاده است. در آزمون علامت، نمونه‌هایی که گره‌دار هستند حذف شده و از مابقی نمونه برای انجام آزمون استفاده می‌شود. به این ترتیب با توجه به توزیع دوجمله‌ای برای W می‌توان از آزمون دوجمله‌ای نیز برای این حالت استفاده کرد. البته همانطور که می‌دانید برای زمانی که m>30 باشد می‌توان از تقریب توزیع نرمال برای توزیع دوجمله‌ای هم بهره گرفت.

آزمون یک طرفه H1:p<0.5 را می‌توان به کمک مقدار احتمال  P(W≥w) انجام داد. به این ترتیب مشخص می‌شود که مقدارهای X دارای رتبه بزرگتری نسبت به مقدارهای Y هستند. به همین ترتیب برای آزمون یک طرفه H1:p>0.5 نیز کافی است که مقدار احتمال را برمبنای P(W≤w′) در نظر گرفت و نشان داد که مقدارهای Y دارای مرتبه بزرگتری نسبت به X هستند. در حالتی که آزمون دو طرفه باشد، مقدار احتمال نیز برابر با «دو برابر کوچکترین مقدار احتمال مربوط به آزمون‌های یک طرفه» خواهد بود.

جهت دانلود آموزش آزمون ها  spss کلیک کنید .

 

مثال 1

به منظور بررسی تناسب پاهای چپ نوعی گوزن اطلاعاتی از طول پای چپ عقب و جلو ۱۰ گوزن ثبت شده است. می‌خواهیم آزمون کنیم که آیا این طول‌ها با یکدیگر از لحاظ آماری اختلاف معنی‌داری دارند یا خیر. این اطلاعات مطابق جدول ثبت شده‌اند.

شماره نمونه طول پای چپ-جلو طول پای چپ-عقب اختلاف
1 142 138 +
2 140 136 +
3 144 147
4 144 139 +
5 142 143
6 146 141 +
7 149 143 +
8 150 145 +
9 142 136 +
10 148 146 +

در اینجا فرض صفر، به صورت یکسان بودن طول پاهای جلویی و عقبی در نظر گرفته شده است. در فرض مقابل نیز وجود اختلاف در طول پاها لحاظ شده در نتیجه آزمون به صورت دو طرفه خواهد بود. بنابراین باید آماره آزمون W یا خیلی بزرگ (بزرگتر یا مساوی ۸) یا خیلی کوچک (کمتر از ۲) باشد تا فرض صفر رد شود.

واضح است که n=m=10 به این معنی که هیچ زوجی دارای مقدار برابر در X و Y نیستند. تعداد علامت‌های مثبت (+) 8 و تعداد علامت‌های منفی (-) نیز 2 است. اگر فرض صفر صحیح باشد، با توجه به توزیع دو جمله‌ای برای اختلاف‌ها با پارامترهای 10 و 0.5 انتظار می‌رود که 5 علامت‌ (+) وجود داشته باشد. به این ترتیب باید مقدارهای زیر را محاسبه کنیم.

P(W≥8|p=0.5)+P(W≤2|p=0.5)=P(W=8|p=0.5)+P(W=9|p=0.5)+P(W=10|p=0.5)+P(W=0|p=0.5)+P(W=1|p=0.5)+P(W=2|p=0.5)=0.04395+0.0077+0.00098+0.00098+0.00977+0.04395=0.109375

بنابراین با توجه به سطح آزمون ۵٪ (0.05) این نمونه، دلیل بر رد فرض صفر (یکسان بودن طول پاها) ارائه نمی‌دهد.

مثال ۲

در یک فروشگاه دو محصول A و B وجود دارند. فروشنده می‌خواهد بسنجد که تمایل مشتریان به کدام محصول بیشتر است. از ده خریدار درخواست می‌کند که نظر خود را در مورد ترجیح خرید از بین دو محصول A و B اعلام کنند. در اینجا فرض صفر یکسان بودن احتمال انتخاب هر یک از محصولات است، در حالیکه می‌توانیم فرض مقابل را ترجیح محصول B بر A در نظر بگیریم. بنابراین اگر p را احتمال انتخاب محصول B بر A در نظر بگیریم، خواهیم داشت.

H0:p=0.5H1:p>0.5

براساس مشاهدات و نظرسنجی از این نمونه ۱۰ تایی از مشتریان، اطلاعات زیر بدست آمده است:

تعداد علامت‌های +  = ۸ (این به معنی ترجیح محصول B بر محصول A توسط ۸ نفر است.)

تعداد علامت‌هایی – = 1 (این به معنی ترجیح محصول A بر محصول B‌ توسط ۱ نفر است.)

تعداد  گره‌ها = ۱ (این به معنی عدم ترجیح یکی بر دیگری توسط ۱ نفر است.)

از آنجایی که تعدا گره‌ها باید از تعداد مشاهدات کم شود، در اینجا m=9 در نظر گرفته می‌شود. احتمال اینکه تعداد مثبت‌ها زیاد (بزرگتر از ۸ باشد) چقدر است؟ اگر فرض صفر صحیح باشد، خواهیم داشت:

P(W≥8|p=0.5)=P(W=8|p=0.5)+P(W=9|p=0.5)=0.0176+0.002=0.0195

با توجه به در نظر گرفتن سطح آزمون α=0.05 فرض صفر رد می‌شود. بنابراین به نظر می‌رسد که محصول B نسبت به A‌ دارای تمایل یا ترجیح بیشتری در بین مشتریان ‍است.

مثال ۳

طول عمر بیمارانی که دچار سرطان هستند مورد بررسی قرار گرفته است. از بین پرونده‌های این بیماران ۱۰ نمونه تصادفی انتخاب شده و طول هفته‌هایی که از زمان مثبت بودن آزمایش تا مرگشان طی شده استخراج شده است. یک نفر نیز با توجه به این که مقدار +۳۶۲ برایش ثبت شده تایید شده که تا پایان دوره بررسی‌ها زنده مانده است. اطلاعات به صورت زیر ثبت و مورد بررسی قرار گرفته‌اند.

49,58,75,110,112,132,151,276,281,362+

قرار است با توجه به این داده‌ها، قضاوت کنیم که میانه طول عمر این گونه بیماران بیشتر یا کمتر از ۲۰۰ هفته است. به این ترتیب به نظر می‌رسد که فرض صفر و فرض مقابل به صورت زیر نوشته می‌شوند.

{H0:Median=200H1:Median≠200

با توجه به خصوصیات آزمون علامت مشخص است که افرادی که بیش از ۲۰۰ هفته عمر کرده‌اند با علامت + و کسانی که کمتر از ۲۰۰ هفته زندگی کرده‌اند نیز با علامت – متمایز می‌شوند. این کار درست به مانند روشی است که برای سنجش میزان اختلاف بین زوج‌ها به کار بردیم. اگر فرض صفر صحیح باشد، نیمی از بیماران باید طول عمری بیشتر از ۲۰۰ یا کمتر از آن داشته باشند.

براساس داده‌های جمع‌آوری شده تعداد علامت‌های (+) برابر با ۷ و تعداد علامت‌های (-) نیز ۳ است. تعداد مثبت‌ها (+) با در نظر گرفتن صحیح بودن فرض صفر دارای توزیع دوجمله‌ای با پارامترهای n=10 و p=0.5 است. بنابراین مقدار احتمال مشاهده بیش از ۷ یا کمتر از ۳ بیمار معیار انجام آزمون است.

احتمالات مربوطه برای هر مقدار از تعداد بیماران با توجه به توزیع دو جمله‌ای با پارامتر n=10 و p=0.5 در جدول زیر آمده است.

k 0 1 2 3 4 5 6 7 8 9 10
Pr 0.0010 0.0098 0.0439 0.1172 0.2051 0.2461 0.2051 0.1172 0.0439 0.0098 0.0010

به این ترتیب احتمال مورد نظر باید از نقاط 0,1,2,3,7,8,9,10 تشکیل شود. بنابراین مجموع احتمالات برای این نقاط برابر است با:

0.0010+0.0098+0.0439+0.1172+0.1172+0.0439+0.0098+0.0010=0.3438

که اگر آزمون را در سطح 0.05 در نظر بگیریم، این نمونه دلیلی برای رد فرض صفر ندارد. در نتیجه به نظر می‌رسد که میانه طول عمر این بیماران برابر با ۲۰۰ هفته خواهد بود. البته ممکن است با توجه به افزایش حجم نمونه بتوان آزمون پرتوان‌تری داشت و به نتیجه بهتر و دقیق‌تری رسید.

 

جهت دانلود آموزش آزمون ها  spss کلیک کنید .

جهت مشاهده جدید ترین آموزش های ویدویی در spss  کلیک کنید .

جهت دانلود فصل چهارم پایان نامه همراه با دیتا در چهار نرم افزار Pls ,  Lisrel , Amos , Spss کلیک کنید .

جهت دانلود پروژه و دیتا همراه با تحلیل در spss  کلیک کنید .

 

منبع: https://blog.faradars.org

 

جهت دانلود آموزش های رایگان spss کلیلک کنید

روش تحقیق در علوم رفتاری

www.cmu.edu

 

آزمون علامت

اشتراک گذاری:

همچنین ممکن است دوست داشته باشید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *