ماتریس چندصفتی-چندروشی (MTMM) چیست؟
ماتریس چندصفتی-چندروشی (MTMM) رویکردی برای بررسی روای سازه است که کمپبل و فیسک (۱۹۵۹) آن را توسعه دادند. این ماتریس، شواهد مربوط به روای همگرا و روای واگرا را سازماندهی میکند تا نشان دهد یک ابزار اندازهگیری چگونه با سایر ابزارها ارتباط دارد. این رویکرد مفهومی، بر طراحی آزمایش و نظریه اندازهگیری در روانشناسی، از جمله کاربردهای آن در مدلهای معادلات ساختاری، تأثیر عمیقی گذاشته است.
تعاریف و اجزای کلیدی
در این رویکرد از چندین صفت (ویژگی) استفاده میشود تا (الف) صفات مشابه یا (ب) صفات غیرمشابه بررسی شوند؛ هدف این است که روای همگرا و واگرا میان صفات تثبیت شود. بهطور مشابه، از چندین روش استفاده میشود تا اثرات تفکیکی ناشی از واریانس خاصِ روش (یا فقدان آن) ارزیابی شود. نمرات ممکن است به این دلیل با هم همبستگی داشته باشند که صفات مشابهی را میسنجند، یا به این دلیل که بر روشهای مشابهی استوارند، یا هر دو. وقتی متغیرهایی که قرار است سازههای متفاوتی را بسنجند، صرفاً به دلیل استفاده از روشهای مشابه همبستگی بالایی نشان میدهند، این وضعیت گاهی با عنوان «واریانس مزاحم» یا «خطای روش» شناخته میشود.
هنگام بررسی روای یک سازه از طریق ماتریس MTMM، شش ملاحظه اصلی وجود دارد:
- ارزیابی روای همگرا: آزمونهایی که برای سنجش یک سازه واحد طراحی شدهاند، باید همبستگی بالایی با یکدیگر داشته باشند.
- ارزیابی روای واگرا (واگراینده): سازهای که یک آزمون میسنجد، نباید با سازههای متفاوت همبستگی بالایی داشته باشد.
- واحد صفت-روش: هر کار یا آزمونِ سنجش یک سازه، یک واحد صفت-روش در نظر گرفته میشود؛ بدین معنا که واریانس موجود در ابزار، بخشی صفت و بخشی روش است. پژوهشگران عموماً واریانس خاصِ روش را پایین و واریانس صفت را بالا میخواهند.
- چندصفتی-چندروشی: برای تثبیت (الف) روای واگرا و (ب) سهم نسبی واریانس صفت یا روش، باید بیش از یک صفت و بیش از یک روش به کار رود. این اصل با ایدههای مطرحشده در مفهوم «استنتاج قوی» پلات (۱۹۶۴) همسو است.
- روششناسی واقعاً متفاوت: هنگام استفاده از روشهای متعدد، باید میزان تفاوت ابزارهای واقعی سنجش در نظر گرفته شود. مثلاً، ارائه دو ابزار خودگزارشی، ابزارهای واقعاً متفاوتی محسوب نمیشوند؛ در حالی که استفاده از یک مقیاس مصاحبه یا یک خوانش روانتنی، متفاوت خواهد بود.
- ویژگیهای صفت: صفات باید آنقدر متفاوت باشند که متمایز تلقی شوند، اما آنقدر مشابه باشند که بررسی آنها در MTMM ارزشمند باشد.
مثال کاربردی
مثال زیر یک ماتریس نمونه اولیه و معنای همبستگیهای میان ابزارها را نشان میدهد. قطر ماتریس معمولاً با ضریب پایایی ابزار (مثلاً ضریب آلفا) پر میشود. توصیفات داخل کروشه [] نشاندهنده آن چیزی است که وقتی روای سازه (مثلاً افسردگی یا اضطراب) و رواییهای ابزارها هر دو بالا باشند، انتظار میرود.
در این مثال، سطر اول، صفتِ ارزیابیشده (یعنی افسردگی یا اضطراب) و همچنین روش ارزیابی آن (یعنی پرسشنامه خودگزارشی در برابر مصاحبه) را فهرست میکند. اصطلاح «دگرروش» (Heteromethod) نشان میدهد که این خانه، همبستگی میان دو روش مجزا را گزارش میکند. «همروش» (Monomethod) نشاندهنده استفاده از یک روش مشابه (مثلاً مصاحبه و مصاحبه) است. «دگرصفت» (Heterotrait) به دو صفتِ ظاهراً متفاوت اشاره دارد و «همصفت» (Monotrait) نشاندهنده سنجش یک صفت واحد است.
این چارچوب بهخوبی روشن میسازد که حداقل دو منبع واریانس میتواند بر نمرات مشاهدهشده یک ابزار اثر بگذارد: نهتنها صفت زیربنایی (که معمولاً هدف اصلی اندازهگیری است)، بلکه روشی که برای گردآوری داده به کار میرود. ماتریس MTMM با استفاده از دو یا چند ابزار برای هر صفت و دو یا چند روش، شروع به تفکیک سهم عوامل مختلف میکند. فریم اول شکل متحرک نشان میدهد که چهار اندازهگیری در جدول، چگونه با تمرکز بر «صفات» افسردگی (BDI و HDRS) و اضطراب (BAI و CGI-A) جفت میشوند. فریم دوم نشان میدهد که آنها از نظر روشِ مبدأ نیز جفت شدهاند: دو مورد از پرسشنامههای خودگزارشی (که اغلب «نظرسنجی» خوانده میشوند) استفاده میکنند و دو مورد بر مبنای مصاحبهاند (که میتواند شامل مشاهده مستقیم ارتباطات غیرکلامی و رفتار، و همچنین پاسخ مصاحبهشونده باشد).
با دادههای مشاهدهشده، میتوان نسبت واریانس مشترک میان صفات و روشها را بررسی کرد تا درکی از میزان واریانس خاصِ روش (که توسط روش اندازهگیری القا میشود) به دست آورد و همچنین نشان داد که صفتِ مدنظر، در مقایسه با صفت دیگر، چقدر متمایز است.
ایدهآل آن است که صفت، اهمیت بیشتری از روشِ انتخابشده برای اندازهگیری داشته باشد. مثلاً، اگر یک شخص در یک ابزار، بسیار افسرده ارزیابی شود، ابزار دیگرِ سنجش افسردگی نیز باید نمرات بالایی به او اختصاص دهد. از سوی دیگر، افرادی که در مقیاس افسردگی بک نمره بالایی میگیرند، لزوماً نباید در مقیاس اضطراب بک نمره اضطراب بالایی دریافت کنند، زیرا قرار است این ابزارها سازههای متفاوتی را بسنجند. از آنجا که این پرسشنامهها توسط یک نفر نوشته شده و از نظر سبک مشابهاند، ممکن است همبستگی اندکی وجود داشته باشد، اما این تشابه روشی نباید نمرات را زیاد تحت تأثیر قرار دهد؛ بنابراین، همبستگی میان ابزارهای سنجش صفات متفاوت باید پایین باشد.
تحلیل آماری
برای تحلیل دادههای ماتریس MTMM از رویکردهای آماری متنوعی استفاده شده است. روش استاندارد کمپبل و فیسک را میتوان با برنامه MTMM.EXE پیادهسازی کرد. به دلیل پیچیدگیهای در نظر گرفتن تمام دادههای ماتریس، میتوان از تحلیل عاملی تأییدی (CFA) نیز استفاده کرد. با این حال، آزمون I ساویلوسکی، تمام دادههای ماتریس را با یک آزمون آماری بدون توزیع برای روند (Trend) در نظر میگیرد.
این آزمون با تقلیل مثلثهای دگرصفت-دگرروش و دگرصفت-همروش، و قطرهای روایی و پایایی، به یک ماتریس چهار سطحی اجرا میشود. هر سطح شامل حداقل، میانه و حداکثر مقدار است. فرض صفر، بینظمی این مقادیر است که در برابر فرض جایگزینِ روندِ افزایشی آزمون میشود. آماره آزمون با شمارش تعداد وارونگیها (I) به دست میآید. مقدار بحرانی برای آلفا = ۰.۰۵ برابر ۱۰ و برای آلفا = ۰.۰۱ برابر ۱۴ است.
یکی از پرکاربردترین مدلها برای تحلیل دادههای MTMM، مدل نمره واقعی (True Score) است که ساریس و اندروز پیشنهاد دادهاند. این مدل با معادلات استانداردشده زیر بیان میشود:
-
معادله اول: در این معادله، متغیر مشاهدهشده استانداردشده با صفت i و روش j، ضرب پایایی در نمره واقعی استانداردشده به علاوه خطای تصادفی است. در نتیجه، ضریب پایایی برابر با مجذور ضریب پایایی خواهد بود.
-
معادله دوم: در این معادله، نمره واقعی استانداردشده، برابر است با ضریب روایی در عامل پنهان استانداردشده برای متغیر مدنظر (صفت)، به علاوه اثر روش (واکنش به روش j). در نتیجه، ضریب روایی برابر با مجذور ضریب روایی است.
-
معادله سوم: ضریب کیفیت، برابر با حاصلضرب ضریب روایی و پایایی است. در نتیجه، کیفیت برابر با مجذور ضریب کیفیت خواهد بود.
مفروضات این مدل عبارتند از:
- خطاها تصادفیاند؛ بنابراین میانگین خطاها صفر است.
- خطاهای تصادفی با یکدیگر همبستگی ندارند.
- خطاهای تصادفی با متغیرهای مستقل (عوامل صفت و روش) همبستگی ندارند.
- فرض بر این است که عوامل روش با یکدیگر و با عوامل صفت، همبستگی ندارند.
معمولاً، پاسخدهنده باید حداقل به سه ابزار متفاوت (یعنی صفات) پاسخ دهد که با حداقل سه روش متفاوت سنجیده شدهاند. این مدل، بهویژه در چارچوب پیمایش اجتماعی اروپا (ESS)، برای تخمین کیفیت هزاران سؤال پیمایشی به کار رفته است.