شرایط یک آزمون خوب(پایایی)
- 5 دی, 1400
- روش تحقیق روانشناسی و علوم تربیتی
شرایط یک آزمون خوب
پایایی (reliability)
همسانی شرایط اجرای آزمون
شرایط آزمون خوب : در جامعه ما نمرههای آزمونها نقش تعبینکنندهای در بسیاری از امور دارند. در کلاسهای مدارس ابتدائی، کودکان اغلب براساس عملکردشان در آزمونهای ریاضی و مهارتهای خواندن، در گروه آموزشی متفاوت جایگزین میشوند. در برخی دبیرستانها دریافت گواهینامه پایان دوره متوسطه مستلزم گذراندن آزمونهای حداقل شایستگی است. در بسیاری از دانشگاهها و مدارس عالی تخصصی و دورههای تحصیلی بعد از لیسانس آزمونها بخشی از برنامه پذیرش دانشجو است.
جهت مشاهده و دانلود پکیج آموزشی پایایی و روایی در spss کلیک کنید .
قابلیت اطمینان یک جنبه حیاتی از یک آزمون خوب در تحقیق و ارزیابی است. این به ثبات، پایداری و قابل اعتماد بودن نتایج آزمون در طول زمان و در موقعیتهای مختلف اشاره دارد. اگر افراد مشابه چندین بار تحت شرایط مشابه آزمایش شوند، یک آزمایش قابل اعتماد باید اندازه گیری های ثابتی را به همراه داشته باشد. در اینجا شرایطی وجود دارد که به قابلیت اطمینان یک آزمون کمک می کند:
قابلیت اطمینان تست-آزمون مجدد:
پایایی آزمون-آزمون مجدد، سازگاری نمرات آزمون را هنگامی که افراد مشابه در دو نوبت جداگانه مورد آزمایش قرار می گیرند، ارزیابی می کند.
یک آزمایش قابل اعتماد باید نتایج مشابهی را در تجویزهای مکرر به همراه داشته باشد، با این فرض که صفت زیربنایی اندازهگیری شده ثابت بماند.
ثبات داخلی:
پایایی سازگاری درونی درجه ای را ارزیابی می کند که آیتم ها یا خرده آزمون های مختلف در همان آزمون نتایج یکسانی را ارائه می دهند.
اندازهگیریهایی مانند آلفای کرونباخ میزان اندازهگیری آیتمهای یک مقیاس یا پرسشنامه را ارزیابی میکنند.
اشکال معادل یا موازی:
قابلیت اطمینان فرم های معادل شامل اجرای دو نسخه از یک آزمون برای یک گروه از افراد و بررسی سازگاری نتایج است.
قابلیت اطمینان فرم های موازی به ویژه زمانی مفید است که آزمون دهندگان ممکن است اولین آزمون را به خاطر بسپارند یا از آن یاد بگیرند.
قابلیت اطمینان بین ارزیاب:
قابلیت اطمینان بین ارزیاب ها، سازگاری نمرات تخصیص یافته توسط ارزیاب ها یا ناظران مختلف را بررسی می کند.
این نوع پایایی در ارزیابیهای ذهنی که در آن قضاوتهای چند ارزیاب دخیل است، بسیار مهم است.
ثبات امتیازدهی:
سازگاری در امتیازدهی به قابلیت اطمینان خود فرآیند امتیازدهی اشاره دارد و اطمینان حاصل می کند که امتیازدهندگان یا نمره دهندگان مختلف معیارهای امتیازدهی را به طور مداوم اعمال می کنند.
ثبات در طول زمان:
یک آزمون قابل اعتماد باید نتایج ثابتی را در طول زمان ایجاد کند، با این فرض که صفت مورد اندازه گیری نسبتاً پایدار باقی می ماند.
حداقل خطای تصادفی:
خطاهای تصادفی در هر فرآیند اندازه گیری انتظار می رود. با این حال، یک آزمون قابل اعتماد باید تأثیر این خطاهای تصادفی را بر نتایج به حداقل برساند.
اجتناب از تعصب:
سوگیری در اجرای آزمون، امتیازدهی، یا تفسیر می تواند بر قابلیت اطمینان تأثیر منفی بگذارد. باید برای به حداقل رساندن تعصب و حفظ عینیت تلاش کرد.
دستورالعمل های واضح و بدون ابهام:
دستورالعملهای واضح و رویههای استاندارد شده برای اجرای آزمون به اطمینان از پاسخهای ثابت شرکتکنندگان کمک میکند.
نمونه مناسب:
نمونه مورد استفاده برای ایجاد قابلیت اطمینان باید معرف جامعه ای باشد که آزمون برای آن در نظر گرفته شده است.
حجم نمونه کافی:
حجم نمونه بزرگتر معمولاً برآوردهای دقیق تری از قابلیت اطمینان ارائه می دهد.
حساسیت به تفاوت ها:
یک آزمون قابل اعتماد باید به اندازه کافی حساس باشد تا تفاوت ها یا تغییرات واقعی در ساختار مورد اندازه گیری را تشخیص دهد.
قابلیت اطمینان برای ایجاد اعتماد در نتایج ارزیابی ها و مطالعات تحقیقاتی ضروری است. محققان و متخصصان اغلب ضرایب قابلیت اطمینان، مانند آلفای کرونباخ یا ضرایب همبستگی درون طبقهای را گزارش میکنند تا نشان دهند که اندازهگیریهایشان تا چه حد سازگار و قابل اعتماد است.
– توصیف آزمونهای توانائی برحسب دو بُعد:
هر آزمون در نقطهای از پیوستار استعداد ـ پیشرفت و همچنین در نقطهای از پیوستار عمومی ـ اختصاصی قرار دارد. برای مثال یک آزمون واژگان زبان فرانسه یا آزمون ماشیننویسی (تعداد واژههائی که آزمودنی میتواند در یک دقیقه بدون اشتباه تایپ کند) در انتهاء ‘پیشرفت’ پیوستار استعداد ـ پیشرفت، و در انتهاء ‘اختصاصی’ پیوستار عمومی ـ اختصاصی قرار دارد.
نیمرخ استعداد موسیقی که مستلزم داشتن معلومات قبلی در زمینه نیست و بهمنظور پیشبینی قابلیت فرد برای بهرهگیری از دروس موسیقی طرح شده، آزمونی است که یک توانائی بسیار اختصاصی را میسنجد و در عین حال در انتهاء ‘استعداد’ بعد استعداد ـ پیشرفت قرار دارد. اکثر آزمونهای هوش مانند مقیاسهای هوشی استانفورد ـ بینه (Stanford – Binet) و کسلر (Wechler) تا حدود زیادی جبنهٔ عمومی دارند به این معنی که سلسله توانائیهائی را میسنجد که بیشتر برای سنجش استعداد طراحی شدهاند تا سنجش میزان تسلط بر مهارتها. آزمونهای پیشرفت تحصیلی از قبیل آزمون استعداد تحصیلی و برنامهٔ ارزیابی دانشگاهی آمریکا نیز کمابیش عمومی هستند، زیرا فراگیریهای کلامی و استدلال ریاضی و درک مطلب را میسنجد و ادعای سنجش تسلط در رشتههای مشخصی را ندارند.
بسیاری از دانشآموزان دبیرستان که به ادامه تحصیل در دانشگاه علاقهمند هستند مجبور هستند آزمون استعداد تحصیلی و یا آزمون ورودی مشابهی نظیر برنامه ارزیابی دانشگاهی آمریکا را بگذرانند. نمرههای این آزمونها همراه با نمرههای دوره دبیرستان و ملاکهای دیگر تعیین میکنند که چه کسانی به دانشگاهها راه مییابند. داوطلبان دانشگاههای حقوق و پزشکی مجبور به گذراندن آزمونهای ورودی ویژهای هستند: آزمون ورودی دانشکده حقوق (Law School Admission Test ـLSAT) و آزمون ورودی دانشگاه پزشکی (Medical College Admission Test ـ MCAT).
جهت مشاهده و دانلود پکیج آموزشی پایایی و روایی در spss کلیک کنید .
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید. (شرایط آزمون خوب )
در بسیاری از دورههای تحصیلات بعد از لیسانس در دانشگاهها، گذراندن امتحان ورودی تحصیلات بعد از لیسانس (Graduate Record Examination ـ GRE) برای داوطلبان اجباری است. داوطلبان ورود به دورههای آموزش مشاغل تخصصی (مانند دندانپزشکی، پرستاری، داروسازی، حسابداری و مدیریت بازرگانی) باید آزمونهای ورودی ویژهای را بگذرانند و پس از پایان تحصیلات خود نیز باید آزمونهای دیگری را بگذرانند تا بتوانند پروانه کار یا گواهینامه تخصص دریافت دارند. دریافت پروانه کار برای اشتغال تقریباً در هر حرفهای اعم از لولهکشی، آرایشگری، فیزیوتراپی، طبابت، روانشناسی بالینی و یا وکالت، مستلزم گذراندن امتحانات کتبی است. علاوه بر اینها در بسیاری از ادارات دولتی و مؤسسات صنعتی گزینش داوطلبان کار، یا جایگزینی و ترفیع کارکنان براساس نمرههای آزمونها صورت میگیرد.
از آنجا که آزمونها چنین نقض مهمی در زندگی افراد دارند، لازم است دقیقاً همانا چیزی را بسنجند که برای سنجش آن ساخته شدهاند، و نمرههای حاصل از آنها میزان معلومات و مهارتهای افراد را بهدرستی نشان دهند. هر آزمون در صورتی میتواند مفید باشد که نمرههای حاصل از آن هم معتبر (Valid) و هم پایا (reliable) باشند.
پایائی (reliability)
نمرههای آزمون هنگامی پایا محسوب میشوند که در آزمایشهای مکرر تغییر نکنند. آزمونها به دلایل متعددی ممکن است ناپایا باشند. سؤالهای مبهم و گیجکننده ممکن است در مواقع مختلف برای آزمودنی معانی متفاوتی داشته باشند. آزمونها ممکن است بیش از حد کوتاه باشند و در نتیجه معرف توانائیهای مورد آزمایش نباشند، و یا نمرهگذاری آنها به شیوهای بسیار شخصی صورت گیرد. آزمونی که بههنگام اجراء در موقعیتهای گوناگون و یا نمرهگذاری توسط افراد مختلف نتایج متفاوتی بهدست دهد ناپایا به حساب میآید. چنین وضعی شبیه استفاده از یک خطکش لاستیکی است. اگر ندانیم این خطکش در موقع اندازهگیری چقدر کش میآید در آن صورت علیرغم دقت کافی در اندازهگیری باز هم نتایج اندازهگیری ناپایا خواهد بود. از نتایج آزمون در صورتی میتوان با اطمینان خاطر استفاده کرد که آزمون پایائی داشته باشد.
جهت مشاهده و دانلود پکیج آموزشی پایایی و روایی در spss کلیک کنید . (شرایط آزمون خوب) (پایایی)
برای ارزیابی میزان پایائی باید برای هر آزمودنی در یک آزمون واحد دو اندازه در دست باشد. این دو اندازه از راه بازآزمائی فرد با آزمون واحد یا آزمایش فرد با دو صورت متفاوت ولی هم ارز آزمون، و تحلیل جداگانه دو نیمه آزمون واحد بهدست میآید هرگاه در موارد هر یک از آزمودنیها مقدار این دو اندازه تقریباً برابر باشد میتوان آزمون را پایا به حساب آورد. البته در مورد آزمونهای پایا نیز ممکن است به خاطر عوامل تصادف و خطاهای اندازهگیری، بین دو نمره یک فرد تفاوتی وجود داشته باشد. در نتیجه ناگزیر باید یک شاخص آماری از رابطه بین سلسله نمرههای جفتی افراد بهدست آورد. ضریب همبستگی (r) میزان این رابطه را بهدست میدهد. ضریب همبستگی بین دو سلسله نمره گروهی از افراد در یک آزمون واحد ضریب پایائی نامیده میشود. ضریب پایائی آزمونهائی که با دقت ساخته شدهاند معمولاً برابر ۹۰/۰ و یا بیشتر است.
اعتبار
هر آزمون هنگامی معتبر شناخته میشود که همان چیزی را بسنجد که برای اندازهگیری آن ساخته شده است. یک امتحان دانشگاهی در رشته اقتصاد که مملو از سؤالاتی پیچیده یا فریبدهنده است ممکن است بهجای مطالب آموخته شده در زمینه اقتصاد، توانائی کلامی دانشجویان را بسنجد. چنین امتحانی ممکن است پایائی داشته باشد (به این معنی که هر دانشجو در بازآزمائی نمرهای معادل نمره قبلی خود بهدست آورد)، اما نمیتوان آن را آزمون معتبری برای سنجش میزان فراگیری آن درس تلقی کرد. یا میتوان آزمونی برای سنجش میزان شوخطبعی تهیه کرد که سؤالهای آن متشکل از شوخیهائی باشد که درک آنها بسیار دشوار است مگر برای افراد بسیار باهوش یا افرادی که کتابهای فراوان خوانده باشند. چنین آزمونی ممکن استت چیزی (مثلاً شاید هوش یا پیشرفت تحصیلی) را به صورتی پایا بسنجد ولی آزمون معتبری برای سنجش شوخطبعی نباشد.
جهت مشاهده و دانلود پکیج آموزشی پایایی و روایی در spss کلیک کنید .
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
برای اندازهگیری اعتبار باید برای هر فرد دو نمره بهدست آورد: نمره آزمون، و شاخص دیگری از توانائی مورد آزمایش. این شاخص دوم ملاک (criterion) خوانده میشود. فرض کنید آزمونی برای پیشبینی موفقیت در ماشیننویسی ساخته شده است. برای تعیین اعتبار این آزمون، آن را به گروهی از افراد پیش از فراگیری فن ماشیننویسی میدهند. پس از پایان دوره آموزشی، تعداد کلماتی که هر آزمودنی میتواند در یک دقیقه به طور صحیح ماشین کند تعیین میشود؛ و این شاخصی است از میزان موفقیت افراد که بهعنوان ملاک از آن استفاده میشود. اینک میتوان بین نمرههای آزمون و نمرههای ملاک ضریب همبستگی حساب کرد. این ضریب همبستگی که بهعنوان ضریب اعتبار (Validity coefficient) شناخته میشود اطلاعاتی در مورد ارزش آزمون از لحاظ هدفی که در ساختن آن موردنظر بوده، بهدست میدهد. هرچه ضریب اعتباری بزرگتر باشد دقیقتر میتوان براساس نتایج آزمون دست به پیشبینی زد.
نکته مهمی که لازم است در اینجا خاطرنشان شود این است که در ارزیابی یک آزمون باید به کاربردهای احتمالی و استنتاجهای آینده براساس نمرههای آن نیز توجه داشت.
همسانی شرایط اجرای آزمون
پایائی و اعتبار آزمون به میزان زیادی بستگی دارد به رعایت همسانی در شیوهٔ اجراء و نمرهگذاری آن. در سنجش توانائی نیز مثل هر نوع اندازهگیری علمی دیگر باید شرایط کنترل شود تا تأثیر متغیرهای نامربوط به حداقل ممکن برسد. بنابراین، آن دسته از آزمونهای توانائی قبول عام یافتهاند که دستورالعملهای اختصاصی، حدهای زمانی (یا فقدان محدودیت زمانی در مورد برخی آزمونها)، و شیوههای نمرهگذاری روشن و مشخصی دارند. توضیحات آزماینده و نحوه ارائه موارد آزمون به آزمودنی باید در تمام اجراءهای آزمون یکسان باشد.
البته نمیتوان همه متغیرهای نامربوط را پیشبینی یا کنترل کرد. مثلاً جنسیت و نژاد آزماینده مسلماً تغییر میکند. این قبیل ویژگیهای فردی، و نیز سلوک عمومی آزماینده (مانند حالت چهره و لحن صدای وی) ممکن است بر عملکرد آزمودنی اثر بگذارند. هر چند اینگونه متغیرها قابل کنترل نیستند اما در ارزیابی نتایج آزمون باید به اثر احتمالی آنها توجه داشت. مثلاً اگر پسربچه سیاهپوستی که بهوسیله یک زن سفیدپوست آزمایش شده عملکرد ضعیفی در آزمون داشته باشد. ممکن است در برابر یک آزماینده مرد سیاهپوست به همان اندازه اضطراب یا انگیزش نشان ندهد.
ارزشیابی عبارت است از سنجیدن عملکرد دانش آموزان و مقایسه کردن آن ها با هدف های آموزشی، به منظور اینکه مشخص شود که آیا فعالیت های آموزشی معلم و کوشش های دانش آموزان به نتیجه مطلوب رسیده است یانه؟
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
جهت مشاهده و دانلود پکیج آموزشی پایایی و روایی در spss کلیک کنید .
مطلب آموزشی بالا مربوط به شرایط آزمون خوب است که در سایت یونی تحلیل آن را در اختیار شما پژوهشگر عزیز قرار داده ایم.
روش تحقیق روانشناسی و علوم تربیتی
شرایط آزمون خوب