نظریه تعمیم پذیری
- 1 دی, 1400
- روش تحقیق روانشناسی و علوم تربیتی
نظریه تعمیم پذیری
نظریه تعمیم پذیری
نظریه تعمیم پذیری: در سال 1964، ريموند بي.کتل(812) سه روش عمده را مطرح کرد که بر اساس آنها “اثبات آزمون” را مي توان اندازه گيري کرد (البته وي اين اصطلاح کلي را بيشتر از اصطلاحهاي ديگر ترجيح مي داد). اولين روش، ثبات و توافق نمره ها در دفعات متوالي اجراست؛ يعني، تغييراتي که در يک آزمون و روي يک گروه از افراد در زمانهاي مختلف صورت مي گيرد. کتل اين ثبات را “پايايي” ناميد.
دومين نوع ثبات به آزمونهاي مختلف ( يا بخشهاي يک آزمون که معمولاً ماده هاي انفرادي هستند) بر مي گردد و شامل توافق مربوط به يک بار اجراست که با استفاده از چند آزمون (يا بخشهاي آزمون) روي يک گروه از افراد صورت مي گيرد. اين ثبات “همگني” ناميده مي شود. نوع سوم ثبات به افراد مختلف بر مي گردد و شامل توافقي است که در مورد معناي نمره هاي يک آزمون که در يک زمان معين روي مجموعه هاي مختلفي از افراد اجرا شده است. اين نوع ثبات “انتقال پذيري” ( يا سرسختي) ناميده مي شود.
در يک رويکرد مشابه، کرونباخ، گليزر(813)، ناندا(814) و راجارتنام(815) (1972) فرض کردند که اساسي ترين موضوع در پايايي، سؤال مربوط به تعميم دادن مشاهده ها يا اندازه گيريها به طبقه ديگري از مشاهده هاست. بنابراين، به نظر آنها پايايي بايد به بررسي ميزاني مربوط شود که بر اساس آن، نمره هاي حاصل، معرف نمره هاي به دست آمده از شرايط ديگر يا “مجموعه هاي مرجع” مختلف است. مثالها مطالعه نمره هاي حاصل از نمره گذاران مختلف، ماده هاي آزمون، روشها، مشاهده کننده ها يا دفعات مختلف را در بر مي گيرند.
همان طوري که در يک بحث دقيق درباره اين روش توسط ويگينز(1973) مورد تأکيد قرار گرفت، يکي از مزيتهاي اصلي اين روش در آن است که پژوهشگران را وا مي دارد که در خصوص مجموعه مرجع خاصي که مايل اند مشاهده هاي خودشان را بدان تعميم دهند، صريح و روشن باشند. اين امر تا اندازه اي از تمايز سنتي بين پايايي و اعتبار مي کاهد. جونز(816)، ريد(817) و پترسون(1975) در نظام کدگذاري رفتاري خودشان، مثال خوبي را در زمينه مطالعه کمّي تعميم پذيري گزارش کردند. در اين مطالعه، آزمودنيها، مشاهده کنندگان و دفعات مختلف، مجموعه هاي مرجع تعميم بودند.
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
نظریه تعمیم پذیری (GT) یک چارچوب آماری است که برای ارزیابی قابلیت اطمینان و تعمیم پذیری نمرات اندازه گیری در زمینه های مختلف، به ویژه هنگامی که با منابع متعدد تنوع سروکار داریم، استفاده می شود. روشهای سنتی تخمین قابلیت اطمینان را با در نظر گرفتن منابع متعدد خطا و تنوع که میتواند بر ثبات و ثبات اندازهگیریها تأثیر بگذارد، گسترش میدهد.
GT به ویژه هنگام ارزیابی سازگاری نمرات در شرایط مختلف، رتبهدهندگان، آیتمها، مناسبتها یا هر عامل دیگری که ممکن است به تغییرپذیری کمک کند، مفید است. این به محققان و متخصصان کمک می کند تا میزان تعمیم نمرات به دست آمده از یک ابزار اندازه گیری را به موقعیت ها یا جمعیت های مختلف درک کنند.
مفاهیم و مولفه های کلیدی نظریه تعمیم پذیری عبارتند از:
جنبه ها:
وجوه منابع مختلفی از تنوع هستند که می توانند بر نمرات اندازه گیری تأثیر بگذارند. اینها میتوانند شامل ارزیابیکنندهها، آیتمها، مناسبتها یا هر عامل مرتبط دیگری باشند. GT هر وجه را به عنوان منبع جداگانه ای از تنوع در نظر می گیرد.
G-Study (مطالعه تعمیم پذیری):
یک مطالعه G برای تخمین سهم نسبی جنبه های مختلف در تنوع کلی در نمرات اندازه گیری انجام می شود. این کمک می کند تا تشخیص دهیم کدام جنبه ها بیشترین تأثیر را بر تنوع امتیاز دارند.
D-Study (مطالعه تصمیم):
یک مطالعه D برای ارزیابی اینکه چگونه منابع مختلف تنوع بر قابلیت اطمینان نمرات در زمینه های تصمیم گیری خاص تأثیر می گذارد، انجام می شود. این به محققان کمک می کند تا تعیین کنند که برای دستیابی به سطح مطلوبی از قابلیت اطمینان برای یک تصمیم معین به چه تعداد مشاهدات یا رتبه بندی نیاز است.
مولفه های واریانس:
GT واریانس در امتیازات اندازه گیری را به اجزای مختلف مرتبط با جنبه های مختلف و تعاملات آنها تجزیه می کند. این مؤلفه ها به تعیین کمیت تأثیر نسبی منابع مختلف تنوع کمک می کنند.
ضریب تعمیم پذیری (ضریب G):
ضریب G نشان دهنده نسبت واریانس نمره کل است که به دلیل تفاوت های واقعی بین افراد یا واحدها است. منابع تنوع در مطالعه را محاسبه می کند و تخمینی از قابلیت اطمینان نمرات ارائه می دهد.
ماتریس طراحی:
ماتریس طراحی برای نمایش ترکیبات وجوه و سطوح آنها که در حال مطالعه است استفاده می شود. این منابع مختلف تنوع تحت بررسی را تشریح می کند.
کنش متقابل وجه به شی:
این تعامل نشاندهنده تغییر در امتیازات به دلیل تعامل بین جنبههای مختلف و اشیاء مورد اندازهگیری است (به عنوان مثال، ارزیابیکنندگان مختلف آیتمهای مختلف را ارزیابی میکنند).
تئوری تعمیم پذیری به ویژه در برخورد با موقعیت هایی که برآوردهای قابلیت اطمینان سنتی (مانند آلفای کرونباخ یا همبستگی درون طبقاتی) ممکن است تصویر کاملی را به دلیل منابع پیچیده تنوع ارائه نکنند، ارزشمند است. GT به محققان کمک می کند تا تصمیمات آگاهانه تری در مورد چگونگی بهبود روش های اندازه گیری، مطالعات طراحی، و اطمینان از اینکه نمرات اندازه گیری را می توان به طور قابل اعتماد به زمینه های مختلف تعمیم داد، اتخاذ کنند.
توجه به این نکته مهم است که نظریه تعمیم پذیری نیاز به درک کاملی از مفاهیم آماری درگیر دارد و اجرای آن می تواند پیچیده تر از روش های سنتی تخمین قابلیت اطمینان باشد. با این حال، ابزار قدرتمندی برای ارزیابی و افزایش قابلیت اطمینان و تعمیم اندازهگیریها در طیف وسیعی از تحقیقات و تنظیمات کاربردی فراهم میکند.
برای تصمیم گیری های آموزشی نیازمند استفاده دقیق از شاخص های روایی و پایایی هستیم.
نظریه نمونه گیری تصادفی که در آن به دنبال تعمیم نتایج از یک نمونه کوچک به جامعه نسبتا بزگ هستیم، شامل دو نظریه کلاسیک اندازه گیری و نظریه تعمیم پذیری می شود.
کرانباخ و همکارانش (کرانباخ، گلسر، ناندا و راجاراتنام، ۱۹۷۲) مفهوم تعمیم پذیری را به عنوان تلاشی برای افزایش دقت تفسیر آزمون، ابداع کرده اند. نظریه تعمیم پذیری، به طور مشخص، منابع منظم و مختلف پراکندگی را در اندازه گیریها بررسی کرده است و راههای برآورد میزان واریانس توزیع شده با این منابع را توصیف میکند.
نظریه تعمیم پذیری به نظریه کلاسیک یا نظریه ضعیف نمره واقعی (فصل سوم) به عنوان نظریه ای که بیش از اندازه ساده و مبهم شده است، توجه میکند و بسیاری از جنبه های نظریه کلاسیک نمره واقعی را موارد خاص تدوین نظریه عمومی تر آزمون که ناشی از نظریه تعمیم پذیری است، تلقی میکند.
طبق گفتهی شولسون ارتباط بین GT و CTT همانند ارتباط بین آنوای عاملی و ساده است. محققی که آنوای ساده را بکار میگیرد، واریانس را به دو مؤلفهی بین گروهی )واریانس منظم( و درونگروهی )واریانس تصادفی( تقسیم میکند.
به شیوهای مشابه، CTT نیز، واریانس را به دو مؤلفه، واریانس واقعی )واریانس منظم( و خطا )واریانس تصادفی( تقسیم میکند. با بکارگیری آنوای عاملی بجای ساده، محقق میپذیرد که عوامل چندگانهای در واریانس کل داده ها سهیم است. آنوای ساده، سؤالات محدودتری را مطرح میکند و نسبت به آنوای عاملی با کارایی کمتری به آنها میپردازد. به همین ترتیب، بسط CTT به GT اثرات چندگانه در واریانس اندازه گیری را تأیید میکند. GT همانند آنوای عاملی، واریانس را به چندین منبع نظیر؛ واریانس منظم در بین اهداف اندازه گیری، منابع چندگانه ی خطا و به تعاملات شان تقسیم میکند.
مفاهیم زیربنایی نظریه تعمیم پذیری:
برخلاف نظریه کلاسیک که زمینه های اجرای آزمون(زمان و شرایط اجرا، نظر تصحیح کنندگان و …) را نادیده می گیرد و برای هر فرد فقط یک نمره واقعی محاسبه می کند، در نظریه تعمیم پذیری، تاثیر عوامل مختاف بر اجرای آزمون و نمره واقعی مورد بررسی قرار می گیرد.در نتیجه برحسب شرایط مختلف، نمره های متفاوتی محاسبه خواهد شد. در این نظریه هر نمره محاسبه شده به عنوان مجموعه از از نمره های ممکن یا مجموعه مرجع نمره معرفی می شود که به وسیله یک یا چند واریانس تبیین می شوند.
هدف اندازهگیری: هدف اندازه گیری عاملی است که محقق عمدتاً روی آن تمرکزمیکند و تغییرپذیری میان آنها مطلوب است. در بسیاری از وضعیتهای اندازه گیری، افرادهدف اندازه گیری هستند.
رویه : رویه عبارت است از مجموعه ای از حالت ها یا سطوح اندازه گیری که قصد داریم عملکرد آزمودنی را در این سطوح مورد اندازه گیری قرار دهیم.
برای مثال وقتی یک آزمون اجرا می کنیم هر سوال یک سطح مورد قبول و کل سوالات آزمون هم رویه مورد قبول را تشکیل می دهند.لذا نمره مشاهده شده یک فرد یک نمونه تصادفی از مجموعه مرجع سوال های قابل قبول فرض می شود و نظریه تعمیم پذیری میزان تعمیم پذیری نمره حاصل از یک آزمون را به مجموعه مرجع سوال های قابل قبول بررسی می کند.
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
به همین منوال، اگر برای تصحیح از چند تصحیح کننده استفاده کنیم، نمره حاصل از تصحیح یک فرد، می تواند نمونه ای تصادفی از نمره های بدست آمده توسط مجموعه مرجع تصحیح کنندگان باشد.
با توجه به آنچه گذشت، نمره مشاهده شده در یک آزمون از رویه های مختلف مانند سوال، تعداد دفعات اجرای آزمون، تعدد تصحیح کنندگان و… تاثیر می پذیرد.لذا اگر فقط یک رویه در آزمون به کار گرفته شود طرح آزمون طرح یک رویه ای گفته می شود و اگر دو رویه بکار گرفته شود طرح دو رویه ای و…
هرچه تعداد رویه ها بیشتر باشد به آزمونگر این امکان را می دهد تا با افزایش سطوح رویه ای که واریانس آن یا واریانس اثر های متقابل آن زیاد است، مقدار واریانس خطا را کاهش دهد.و از این طریق ضریب تعمیم پذیری نمره مشاهده شده به نمره مجموعه مرجع را افزایش دهد.
ضریب تعمیم پذیری با نسبت واریانس نمره جامعه به واریانس نمره مشاهده شده برابر است و این ضریب، همتای ضریب پایایی به کار برده شده در نظریه کلاسیک نمره واقعی است. یک آزمون،تنها یک ضریب تعمیم پذیری ندارد، بلکه دارای ضرایب زیادی است که به سطوح مورد بررسی در مطالعه G وابسته اند. مطالعه G، به همین ترتیب، اطلاعات لازم را درباره چگونگی برآورد نمره جامعه آزمودنی با بیشترین دقت، فراهم می کند.
در طرح یک رویه ای افراد آزمودنی هدف اندازه گیری بوده و تشخیص واریانس های نمره حقیقی یا همان تفاوت های فردی مورد نظر است.در این طرح نمره کسب شده به مجموعه مرجع نمره های قابل قبول در رویه سوال (نمره ممکن در تمام سوال های ممکن) تعمیم داده می شود.
در طرح دو رویه ای هم افراد آزمودنی هدف اندازه گیری قرار دارند و و تفاوت های فردی بین آنها واریانس نمره حقیقی محسوب می شود. در این طرح نیز نمره کسب شده توسط هر فرد به محموعه مرجع نمره های قابل قبول در همان دو رویه نسبت داده می شود.
رویه تصادفی: اگر سطوح رویه مورد بررسی ردر اندازه گیری به صورت تصادفی از میان مجموعه مرجع سطوح ممکن آن رویه انتخاب شده باشند، آن را رویه تصادفی می نامند. در چنین حالتی سطوح انتخاب شده برای اندازه گیری در هربار اجرای آزمون متفاوت خواهد بود. مثلا هر بار تعداد خاصیاز سوال ها یا تعداد خاصی از مصححان از میان سطوح قابل قبول سوال یا تصحیح کننده انتخاب و عملکرد آنها به مجموعه مرجع مورد قبول همان رویه تعمیم داده می شود.
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
تعمیم پذیری یک نظریه با رویه تصادفی است و در هر اندازه گیری حداقل یکی از رویه ها باید تصادفی باشد.
استفاده از نظریه تعمیم پذیری مستلزم انجام دادن دو نوع مطالعه است: مطالعه تعمیم پذیری (G) و مطالعه تصمیمی (D). مطالعه G، به عنوان بخشی از توسعه ابزار اندازه گیری صورت می گیرد. هدف عمده این مطالعه، تعیین درجه ای است که درآن، نتایج آزمون در شرایط مختلف اندازه گیری، معادل با یکدیگرند. به عبارت ساده تر، مطالعه G مستلزم جمع آوری داده ها برای آزمودنیهایی است که در شرایط معین، آزمون شده اند( برای آنهایی که در سطوح مختلف معین شده اند).برآورد واریانس اجزای ناشی از این سطوح و کنش متقابل بین آنها، با استفاده از تجزیه و تحلیل واریانس (به هیز، ۱۹۷۳مراجعه کنید) وایجاد ضرایب تعمیم است
مطالعه D، ابزار اندازه گیری داده هایی را به وجود می آورد که در تصمیم گیری یا رسیدن به نتایج به کار برده میشوند؛ مانند پذیرش اافراد در برنامه ها یا شناسایی کودکانی که دارای مهارتهای معینی در خواندن هستند. اطلاعات بدست آمده از مطالعه G، در تفسیر نتایج مطالعه D و دستیابی به نتایج دقیق مورد استفاده قرار میگیرند.
شناسایی و جداسازی منابع چندگانه خطای اندازه گیری و برآورد هر یک از آنها، تمایز گذاشتن میان تصمیمهای نسبی و مطلق، تمایز گذاشتن میان رویه های اندازه گیری ثابت و تصادفی و همچنین پرداختن به طرحهای مختلف مطالعه D را میتوان ازجمله نقاط قوت نظریه تعمیم پذیری ذکر کرد که نظیر آنها درنظریه کلاسیک آزمون وجود ندارد.
CTT چون نمیتواند خطای اندازه گیری منظم را در خود جای دهد، تنها برای سنجش اعتبار آزمونهای هنجار مرجع مناسب است. درحالیکه GT به دلیل انعطاف پذیری که دارد هر دو خطای اندازه گیری نسبی و مطلق را در خود جای میدهد و میان تصمیم های نسبی و مطلق تمایز میگذارد؛ بنابراین، هم برای سنجش هنجار مرجع مناسب است و هم نسبت به CTT ، برآورد مناسبی از اعتبار را برای آزمونهای ملاک مرجع فراهم می آورد.
جهت مشاهده مطالب روش تحقیق در روانشناسی و علوم تربیتی کلیک کنید.
مطلب آموزشی بالا مربوط به نظریه تعمیم پذیری است که در سایت یونی تحلیل آن را در اختیار شما پژوهشگر عزیز قرار داده ایم.