اصطلاحات سنجش آزمون


هنجار آزمون

  • اگر برای تفسیر نمرۀ یک دانش آموز آن نمره را با میانه یا میانگین نمرۀ یک گروه مرجع مقایسه کنیم به آن گروه مرجع گروه هنجار می گویند.گروه مرجع از کسانی تشکیل می یابد که به گونه ای شبیه به دانش آموز مورد نظر هستند. بنابراین، فایدۀ هنجار این است که برای قضاوت دربارۀ سطح نسبی عملکرد یک فرد به عنوان معیار به کار می رود.هنجار یابی یکی از مراحل اصلی در استاندارد کردن آزمون های وابسته به هنجار است. در تعیین هنجار برای یک آزمون، باید سوال زیر را مورد توجه قرارداد:
    آزمون در مورد چه گروهی به کار خواهد رفت؟
     برای مثال اگر آزمون برای اندازه گیری ویژگیهای شخصیتی زنان به کار خواهد رفت، گروه مرجع یا گروه هنجار باید نمونه ای از تمام زنان باشد.یا اگر آزمون برای سنجش آمادگی خواندن کودکان پیش دبستانی به کار خواهد رفت، گروه مرجع باید از کودکان پیش دبستانی که هنوز آموزش خواندن را شروع نکرده اند تشکیل یابد.
    هنجارهای مربوط به نمرات معیار موقعیت نسبی یک دانش آموز در یک گروه با نشان دادن فاصلۀ نمرۀ او از میانگین نمرات معلوم می‌شود. نمرات معیار، عملکرد هر دانش آموز را در یک آزمون، بنا بر اختلاف عملکرد او از میانگین گروه، بر حسب واحد انحراف معیار نشان می دهد .
    نمرهz آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(1) هستند به نمرات z (نمرات زی) شهرت دارند .
    نمره T مجموعه نمرات معیار دیگری که به نمرات T (نمرات تی ) شهرت دارند برای رفع مشکلات نمرات z ابداع شده اند.

تعریف و انواع روایی آزمون

  • روایی اصطلاحی است که به هدفی که آزمون برای تحقق بخشیدن به آن درست شده است اشاره می‌کند.لین وگرانلاند (2000) روایی را یه صورت "یک ارزشیابی از کفایت و مناسبت تفسیرها و استفاده های نتایج سنجش" (ص73) تعریف کرده‌اند. کاپلان و ساکوزو (2001) گفته‌اند "روایی می‌توان به صورت به صورت توافق بین نمرۀ آزمون و کیفیتی که قرار است اندازه بگیرد تعریف کرد" (ص132). بنابر آنچه گفته شد، آزمونی دارای روایی است که برای اندازه گیری آنچه مورد نظر است کافی و مناسب باشد. برای مثال، یک آزمون پیشرفت تحصیلی ریاضی پنجم دبستان در صورتی یک آزمون رواست که محتوا و هدفهای آن درس را به خوبی آندازه گیری کند و بجز یادگیری دانش‌آموزان از آن درس چیز دیگری را شامل نباشد به عنوان مثالی دیگر از روایی، یک آزمون هوشی روا آزمونی است که تنها هوش افراد را اندازه گیری کند نه چیز دیگری را. بنابراین، یک آزمون ممکن است از جهتی روا باشد اما از جهاتی دیگر روا نباشد. پس، روایی یک امر نسبی است، نه یک ویژگی که هست یا نیست. آزمونهای مورد استفاده در آموزش و پرورش و روانشناسی دارای سه هدف عمده هستند که به سه پرسش زیر پاسخ می‌دهند.

    1. آیا سوالهای آزمون از محتوای درس یا موضوع مورد نظر یک نمونۀ خوب ارائه می‌دهند؟

    2. آیا نمرات آزمون عملکرد فعلی یا آتی دانش آموزان را پیش بینی می کنند.

    3. آیا نمرات آزمون به مفاهیم نظری یا سازه هایی که آزمون برای سنجش آنها درست شده است مربوط اند؟

    سه مورد بالا به ترتیب سه نوع روایی محتوایی، ملاکی، و سازه را نشان می دهند.

تعریف پایایی آزمون

  • پایایی یک وسیلۀ اندازه گیری عمدتاً به دقت نتایج حاصل از آن اشاره می کند. کاپلان و ساکوزوا (2001) گفته‌اند" پایایی به دقت، اعتماد پذیری، ثبات، با تکرار پذیری نتایج آزمون اشاره می‌کند" (ص 11). رابطۀ بین روایی و پایایی از این قرار است که یک آزمون باید پایا باشد تا بتواند روا باشد. اگر آزمونی در هر بار اجرا بر روی تعدادی از دانش آموز نتایج مختلفی به دست دهد آن آزمون یک آزمون پایا نخواهد بود و در واقع هیچ چیز را به درستی اندازه نخواهد گرفت، و اگر یک آزمون چیزی را به درستی اندازه‌گیری نکند هیچ اطلاع مفیدی به ما نخواهد داد. برای مثال، یک آزمون حساب برای اندازه گیری محتوا و هدفهای درس تاریخ روا (مناسب) نیست، اما این آزمون می تواند مطالب حساب را که اندازه می‌گیرد با دقت (به طور پایا) اندازه گیری کند. پس، برای اینکه یک آزمون روا باشد باید نخست پایا باشد. یعنی پایایی شرط روایی است، اما روایی برای پایایی ضروری نیست.

  • روشهای تعیین پایایی
  • روشهای تعیین پایایی متنوع‌اند و ما آنها را با استفاده از پیشنهادهای ایبل (1972)، ویرسما و جورس (1990)، و مرفی و دیویدشوفر(1994) به شرح زیر دسته بندی می‌کنیم:
  • روش پایایی مصححان،
  • روش بازآزمایی،
  •  روش فرم‌های هم ارز،
  •  و روشهای همسانی درونی (روش دو نیمه کردن آزمون، روش کودر- ریچاردسون، و روش ضریب القای کرانباخ).
  • در روش دو نیمه کردن آزمون، آزمون‌ مورد نظر را یک بار با گروه واحدی از آزمون شوندگان اجرا می کنیم و، پس از اجرا، آن را به دو نیمه تقسیم می‌نماییم. در این روش، بهترین راه دو نیمه کردن آزمون این است که همۀ سوالهای فرد را یک آزمون به حساب آوریم، و همۀ سوالهای زوج را نیز آزمون دیگری بدانیم. ضریب همبستگی حاصل از نمرات دو نیمۀ آزمون ضریب پایایی هر یک از دو نیمه خواهد بود.

  • روش کورد ریچاردسون
  • در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا می‌شود، اما در این روش همۀ ماده‌های آزمون تحلیل می‌شوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین پایایی آن دو فرمول مورد استفاده قرار داده‌اند که به 20kR و 21 KR شهرت دارند.

  • روش ضریب الفا
  • سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته می‌شود

حد تسلط آزمون

  • تمیز بین حد تسلط و غیر حد تسلط :
  • از آنجا که آزمونهای وابسته به ملاک دارای یک نمرۀ مرزی برای حد تسلط هستند، مثلاً نمره 85 از 100، بنابراین لازم است معلوم شود که آیا سوالهای آزمون در آن نقطه بین آزمون شوندگان قوی و ضعیف تمیز قائل می شوند یا نه. در شکل زیر حرف a معرف تعداد آزمون شوندگانی است که سوال را درست جواب داده اند اما در کل آزمون نمره ای کمتر از حد تسلط گرفته اند .همچنین b تعداد آزمون شوندگانی است که سوال را درست جواب داده اند و در نمره کل آزمون نیز به حد تسلط رسیده اند .حرف c نشان دهندۀ تعداد آزمون شوندگانی است که سوال را غلط جواب داده اند و در کل به حد تسلط نرسیده اند. و بالاخره حرف d معرف تعداد کسانی است که سوال مورد نظر را درست جواب نداده اند اما در نمره کل آزمون به حد تسلط رسیده اند. تعداد آزمون شوندگانی که به حد تسلط رسیده اند برابر است با b+d و تعداد کسانی که به حد تسلط نرسیده اند مساوی است با a+c .
  • حد تسلط
  • ضریب تمیز، یعنی D، برابر است با تفاوت بین سطوح دشواری سوال برای کسانی که به حد تسلط رسیده و آنهایی که به حد تسلط نرسیده اند، مطابق با فرمول زیر:
  • حد تسلط
  • این ضریب تمیز از 1- تا 1+ متغیر است. مقدار مثبت D نشان می دهد که سوال بین کسانی که به حد تسلط رسیده و کسانی که به حد تسلط نرسیده اند تمیز قائل شده است . وقتی که ضریب تمیز سوالی منفی است، نشان دهنده آن است که سوال در جهت خلاف سوالهای دیگر تمیز قائل می شود. چنین سوالی نیاز به بازبینی دارد.

نمرهz

  • آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(1) هستند به نمرات z (نمرات زی) شهرت دارند .
  • برای تبدیل نمرات خام به نمرات z از فرمول زیر استفاده می شود:
     نمره Z
  • نمرۀ z نشان می دهد که یک نمرۀ خام به اندازۀ چه تعداد از واحدهای انحراف معیار بالاتر یا پایین تر از میانگین است. 

نمره T

  • مجموعه نمرات معیار دیگری که به نمرات( T Score ) شهرت دارند برای رفع مشکلات نمرات Z ابداع شده اند. مقیاس نمرات T با ضرب نمرات Z در 10 و جمع کردن نمرات حاصل با 50 به دست می آید .بنابراین، آن دسته از نمرات معیار که دارای توزیعی با میانگین 50 و انحراف معیار 10 است توزیع نمرات T نام دارد. می توان فرمول محاسبۀ نمرات T را به صورت زیر نوشت:
     T=10(z)+50

نمرات 9 بخشی

  • 9- بسیار عالی ( 4% بالا)
  • 8- عالی(7% بعدی)
  • 7- خیلی خوب(12% بعدی)
  • 6- خوب (17% بعدی)
  • 5- متوسط(20%)
  • 4- نسبتاً ضعیف(17% بعدی)
  • 3- ضعیف(12% بعدی)
  • 2- خیلی ضعیف(7% بعدی)
  • 1-بیش از حد ضعیف(4% آخر)

گزینه های انحرافی

  •  علاوه بر تعیین ضریبهای دشواری و تمیز برای هر سوال، بررسی نحوۀ پراکندگی پاسخهای مربوط به گزینه های انحرافی هر سوال ضروری است. در تحلیل گزینه های انحرافی قاعدۀ کلی به شرح زیر است: هر گزینۀ انحرافی دست کم باید یک نفر از افراد گروه ضعیف را به خود جلب می کند تعداد افراد گروه ضعیف باید بیشتر از تعداد افراد گروه قوی باشد.دلیل این امر را به این گونه می توان توضیح داد که افراد گروه ضعیف در مجموع اطلاعات کمتری از مطالب آزمون دارند. بنابراین، در صورتی یک سوال به خوبی عمل می کند که افراد ضعیف بیشتر از افراد گروه قوی گزینه های انحرافی آن سوال را انتخاب نمایند.
  • تحلیل گزینه های انحرافی به کمک منحنی ویژگی سوال:
  •  در نظریه سوال- پاسخ هر یک از گزینه های یک سوال چند گزینه ای ( چه گزینه درست و چه گزینه های انحرافی) می تواند اطلاعاتی دربارۀ دانش یا مهارت پاسخ دهنده به دست دهد.برای این منظور، لازم است، علاوه بر منحنی ویژگی گزینۀ درست، برای گزینه های غلط نیز منحنی ویژگی رسم کنیم.به عنوان نمونه، شکل 15-13 هم منحنی ویژگی گزینۀ درست (الف) و هم منحنیهای ویژگی گزینه های انحرافی، (ب،ج،د) را نشان می دهد. چنان که در شکل دیده می شود، گزینۀ درست یا گزینۀ الف دارای قدرت تمیز مثبت و بالاست.گزینۀ انحرافی ج نیز دارای قدرت تمیز مثبت و نسبتاً بالاست.اما گزینۀ د را کمتر کسی انتخاب کرده و قدرت تمیز ندارد.گزینۀ ب دارای قدرت تمیز منفی است، یعنی پاسخ دهندگان ضعیف بیشتر از پاسخ دهندگان قوی آن را انتخاب کرده اند.
  • منحنی سوال

منحنی ویژگی سوال

  • منحنی ویژگی سوال  یک بازنمایی نموداری از رابطۀ بین احتمال پاسخ درست دادن به یک سوال و موقعیت آزمون شونده در صفت مورد اندازه گیری توسط آزمون است. همچنین می توان گفت که منحنی ویژگی سوال احتمال پاسخ درست دادن را نسبت به صفت مکنون تعیین می کند. برای تهیه منحنی ویژگی یک سوال، نسبت یا درصد آزمون شوندگانی که آن سوال را درست جواب داده اند در رابطه با نوعی ملاک یا معیار، مثلا نمرۀ کل آزمون آنها، رسم می شود. به سخن دیگر، بر روی منحنی افقی نمرۀ کل آزمون و بر روی محور عمودی نسبت آزمون شوندگانی که به سوال پاسخ درست داده اند مشخص می شود.
    دقت کنید که در منحنی ویژگی سوال 1 (شکل زیر) نسبتهای درست برای این سوال همراه با افزایش نمرۀ کل آزمون افزایش می یابد.این مطلب نشان می دهد که:
     هر چه نمرۀ کل آزمون یک فرد بزرگتر باشد با احتمال بیشتری به این سوال پاسخ درست خواهد داد.
    از روی منحنی ویژگی سوال می توان ضریبها دشواری و تمیز را تعیین نمود. ضریب دشواری عبارت است از نمره معیاری که در ان 50 درصد آزمون شوندگان سوال درست را پاسخ داده اند.
    ضریب تمیز برابر است با شیب منحنی ویژگی سوال.
    اگر همه آزمون شوندگان به یک سوال جواب درست بدهند منحنی آن یک خط افقی واقع در بالای محور عمودی خواهد بود و اگر همه آزمون شوندگان به یک سوال جواب غلط بدهند منحنی ویژگی سوال آن نیز یک خط افقی خواهد بود.
    در شکل زیر منحنی ویژگی های پنج سوال با هم مقایسه شده اند.
    سوال الف) یک سوال ضعیف است زیرا بین آزمون شوندگان قوی و ضعیف تمیز قائل نمی شود.
    سوال ب)  یک سوال معیوب است زیرا این سوال با کل آزمون رابطه معکوس دارد به عبارت دیگر ضریب تمیز منفی دارد
    سوال های  پ) و ت)  سوال های نسبتا خوبی هستند.
    منحنی ویژگی سوال ث از منحنی ویژگی سوال پ  و   ت شیب کمتری دارد و نتیجه می گیریم که نمی تواند به خوبی سوالات پ وت تیمز بین گروه های قوی و ضعیف را انجام دهد
    منحنی سوال


    برازنده کردن منحنی ویژگی سوال:

    برای استفاده بیشتر از منحنی سوال ، سعی می شود که مناسب ترین منحنی ریاضی آن سوال رسم شود. در صورتی که منحنی ریاضی سوال به نحو صحیحی رسم شود با کمک آن چند پارامتر مهم سوال را تعیین نمود:

     1. پارامتر a که نشان دهندۀ شکل یا شیب منحنی ویژگی سوال است. چنان که قبلا دیدیم، شیب صعودی یا منحنی دارای شکل پلکانی نشان دهندۀ قدرت تمیز زیاد سوال است.
     2. پارامتر b معرف آستانه یا همان ضریب دشواری سوال است. ضریب دشواری سوال برابر است با نمره ای از آزمون که آزمون که مقابل با نقطۀ تغییر یا نقطۀ عطف منحنی ویژگی سوال است.
     3. پارامتر c یا پارامتر تصادف میزان حدس پذیری سوال را مشخص می کند.هر چه امکان کسب نمره از راه حدس زدن در یک سوال بیشتر باشد مقدار c برای آن سوال نیز بزرگ تر است.  

    منحنی سوال

ضریب تمیز

  • ضریب تمیز که با d نشان داده می شود قدرت سوال را در تمایز گذاری یا تشخیص بین گروه قوی و گروه ضعیف آزمون شوندگان مشخص می کند،(بر خلاف ضریب دشواری که میزان آسان بودن یا دشوار بودن یک سوال را برای گروه آزمون شوندگان نشان می دهد،)  یعنی معلوم می‌نماید که سوال تا چه اندازه می تواند گروه قوی را از گروه ضعیف جدا سازد. برای محاسبۀ ضریب تمیز یک سوال از فرمول زیر استفاده می شود:
  • ضریب تمیز
  • تفسیر ضریب :
  • تمیز هر قدر ضریب تمیز بزرگتر باشد، قوه تمیز آن سوال بیشتر و هر قدر این ضریب کوچکتر باشد قوۀ تمیز آن کمتر است. گاه اتفاق می افتد که ضریب تمیز سوالی منفی است.این نوع ضریب تمیز نشان می دهد مه در آن سوال گروه قوی بدتر از گروه ضعیف عمل کرده است. این گونه سوالها دارای معایب اساسی هستند که یا باید به کلی کنار گذاشته شوند یا در آنها تجدید نظر اساسی صورت پذیرد.اگر سوال دارای اشکال فنی نباشد، دلیل چنین ضریبی می تواند این باشد که افراد گروه بالا یا آن سوال را به طور کامل یاد نگرفته اند یا آن را به غلط آموخته اند.بنابراین، تمامی ضریبهای تمیز سوالهای آزمون باید مثبت باشند.
  • رابطه بین ضریب تمیز و ضریب دشواری به صورت زیر است:
  • ضریب تمیز

ضریب دشواری

  • محاسبه ضریب دشواری سوال بنا به تعریف، درصد کل آزمون شوندگانی که به سک سوال جواب درست میدهند ضریب دشواری آن سوال است که با حرف P نشان داده می‌شود.اگر در تحلیل یک سوال کلیه افراد یا کلیه برگه‌های امتحانی دخالت داشته باشند برای محاسبه‌ی ضریب دشواری سوال آن کافی است که تعداد کل افرادی را که به آن سوال جواب درست داده‌اند بر تعداد کل آزمون شوندگان تقسیم کنیم و نتیجه را در 100 ضرب نماییم. رقم حاصل ضریب دشواری سوال است. مطابق فرمول زیر:  
  • ضریب دشواری
  • در این فرمول R معرف تعداد کسانی است که به سوال جواب درست داده و T نشان دهنده تعداد کل آزمون شوندگان است. در مواردی که تعداد آزمون شوندگان( تعداد برگه‌های آزمون) زیاد است و اطلاعات ما به نحوۀ پاسخدهی افراد گروه بالا و گروه پایین محدود می‌شود، لازم است از فرمول زیر استفاده کنیم:
  • ضریب دشواری
  • بر اساس توضیحات بالا، هر اندازه ضریب دشواری یک سوال بزرگ‍‌تر (به 100 نزدیک تر) باشد، آن سوال آسان تر است و هر اندازه که این ضریب کوچک تر (به صفر نزدیک تر) باشد سوال دشوارتر است. چنان که ملاحظه شد، فرمول بالا ضریب دشواری را بر حسب یک عدد صحیح دو رقمی نشان می‌دهد. برخی از متخصصان اندازه گیری و ارزشیابی ترجیح می‌دهند که این ضریب، مانند ضریب تمیز، بر حسب اعداد اعشاری باشد که تفسیر آن با تفسیر ضریب تمیز همانند صورت گیرد.
  • تفسیر ضریب دشواری:
  • اگر در تفسیر ضریب دشواری یا ضریب سهولت سوال با آزمونهای وابسته به هنجار سر و کار داشته باشیم، می‌توانیم این ضریت را از دیدگاه آماری مورد بررسی قرار دهیم. یکی از انتظارات ما از آزمون‌های وابسته به هنجار این است که برای آزمون شوندگان مختلف نمراتی به دست می‌دهد که در آن طول یک پیوستار پراکنده باشند، و هر چه این پراکندگی بیشتر باشد بهتر است. به سخن دیگر، هر چه واریانس نمرات حاصل از یک آزمون وابسته به هنجار بزرگ تر باشد آن آزمون آزمون بهتری است. در نتیجه، از لحاظ انتخاب برای گنجانیدن در فرم نهایی آزمون، سوالهایی بهتر هستند که ضریب دشواری آنها از 1 کمتر و از صفر بیشتر و به 5/0 نزدیک باشد.البته انتخاب سوالهایی با ضرایب دشواری مناسب به نوع سوالهای آزمون مربوط است. در آزمونهای صحیح – غلط ضریب دشواری5/0 P= زمانی بدست می آید که همۀ آزمودنیها با حدس زدن به سوال جواب بدهند.آلن وین (1979) گفته اند برای آزمونهای چند گزینه‌ای سطح بهینۀ دشواری اندکی کمتر از وسط فاصلۀ بین 1 و سطح موفقیت با حدس زدن است.منظور از سطح موفقیت با حدس زدن عبارت است از نسبت پاسخهای درستی که با حدس زدن حدود 25/0 است، و لذا سطح بهینۀ دشواری در وسط 25/0 و 1 یعنی در حدود 6/0 خواهد بود. برای تعیین رقم دقیق معرف ضریب دشواری بهینۀ سوال، ابتدا سطح موفقیت 100% را از سطح عملکرد با حدس زدن (مثلاً 25%) کم می کنیم و نتیجه را به 2 تقسیم می نماییم و نقطۀ میانی را مشخص می کنیم.
  • ضریب دشواری
  • پس از آن، حاصل از محاسبات بالا ( یعنی نقطۀ میانی ) را با سطح معرف عملکرد از طریق حدس زدن جمع می کنیم . به طور کلی، ضریبهای دشواری بین 3/0 و 7/0 حداکثر اطلاع را دربارۀ تفاوت بین آزمودنیها به دست می دهند.

ضریب کورد ریچاردسون

  • در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا می‌شود، اما در این روش همۀ ماده‌های آزمون تحلیل می‌شوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین پایایی آن دو فرمول مورد استفاده قرار داده‌اند که به20 kR و 21 KR شهرت دارند.

    KRفرمول 20

    به فرض اینکه تمام سوالهای آزمون دارای ضریب دشواری متوسط باشند، می توان به جای فرمول 20 KR از فرمول 21 KR به شرح زیر استفاده کرد:
    KRفرمول 21
    چنان ‌که گفتیم، در استفاده از فرمول 21 KR فرض بر این است که همۀ سوالها یا ماده‌های آزمون از لحاظ درجۀ دشواری شبیه به هم هستند. هر قدر از لحاظ درجۀ دشواری میان سوالهای آزمون تفاوت وجود داشته باشد، به همان نسبت از ضریب پایایی حاصل از فرمول21 KR کاسته می‌شود. اگر فرض شباهت درجۀ دشواری سوالها صحیح باشد، استفاده از این فرمول بسیار ساده‌تر از فرمول 20 kR است، زیرا در استفاده از فرمول 21 KR نیازی به محاسبۀ نسبت پاسخهای درست برای تک تک سوالهای آزمون نیست و تنها با داشتن سه جزء اطلاع زیر:
    یعنی تعداد سوالها (n) میانگین نمرات آزمون (  X ̅)
    و واریانس کل آزمون محاسبۀ ضریب پایایی مسیر است.

    فرض اساسی فرمولهای کودر و ریچاردسون این است که سوالهای آزمون را می‌توان به صورت 1 برای پاسخ درست و 0 (صفر) برای پاسخ غلط تصحیح کرد. بنابراین نمی‌توان این فرمولها را برای محاسبۀ ضریب پایایی پرسشنامه‌هایی که پاسخهای آنها از 1 تا 4 یا 5 را شامل می‌شوند مورد استفاده قرار داد

ضریب آلفای کرونباخ

  • سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته می‌شود
    روش آلفای کرانباخ در شرایطی که نمرات سوال نه به صورت دو ارزشی صفر و 1 بلکه به صورت چند ارزشی تعیین می‌شود و 20 KR برای آن مناسب نیست قابل استفاده است – مثلاً در رابطه با نمرات حاصل از پرسشنامه‌های شخصیت یا نگرش‌سنج که پاسخ دهنده به هر سوال در طیفی از مثلاً کاملاً موافق تا کاملاً مخالف (5 تا 1) جواب می‌دهد و هیچ یک از آنها درست یا غلط محسوب نمی‌شود .
    اگر بخشهای آزمون یا خرده آزمونهایی که از مجموع آنها آزمون کلی تشکیل شده است به طور جداگانه نمره گذاری بشوند، در آن صورت ضریب آلفا مستلزم این نیست که سوالهای انفرادی به صورت درست و غلط تصحیح شوند
     کرانباخ (1951) واضع این روش تعیین پایایی است. در این روش، اجزا یا قسمتهای آزمون برای سنجش ضریب پایایی آزمون به کار می‌روند. اگر قسمتهای "آزمون همان سوالهای آزمون باشند و سوالها به صورت درست (1) و غلط (0) تصحیح بشوند، ضریب آلفا برابر خواهد بود با 20 KR (روش کودر ریچارسون)که قبلا معرفی شد. اما اگر، به جای سوالها یا ماده‌ها، آزمون از بخشها یا قسمنهایی تشکیل شده باشد، مثل زمانی که یک آزمون از تعدادی خرده آزمون تشکیل یافته است، و بخواهیم از آنها در محاسبۀ ضریب پایایی کل آزمون استفاده کنیم، آنگاه از روش کرانباخ مطابق با فرمول زیر استفاده می‌کنیم:

    ضریب آلفای کرونباخ

ضریب همبستگی

  • همبستگی بین نمرات در تعبیر و تفسیر نمرات دانش‌آموزان و دانشجویان، گاه لازم می‌آید که رابطۀ بین دو یا چند دسته نمره را تعیین کنیم. برای مثال، اغلب سوال می‌شود که نمرات هوش و نمرات پیشرفت تحصیلی چه رابطه‌ای با هم دارند، و بسیاری از معلمان علاقه مندند که بدانند بین نمرات پیشرفت تحصیلی سالهای قبل و بعد رابطه‌ای وجود دارد یا نه .میزان رابطۀ بین دو دسته نمرۀ متعلق به گروه واحدی از دانش‌آموزان یا دانشجویان را با محاسبۀ ضریب همبستگی مشخص می‌کنند متداولترین روش تعیین همبستگی، روش محاسبۀ ضریب همبستگی گشتاوری پیرسون است.این ضریب همبستگی با r نشان داده می‌شود.
  • تفسیر ضریب همبستگی
  •  1. رابطۀ بین متغیرهای مورد نظر ممکن است از جمعیتی به جمعیت دیگر فرق کند.
  •  2. هر چه افراد مورد نظر در متغیرهایی که ضریب همبستگی بین آنها محاسبه می‌شود نامتناجس تر باشند ضریب همبستگی حاصل بزرگتر است.

  •  3. ممکن است وجود همبستگی بین دو متغیر به علت یک رابطۀ واقعی بین آن دو نباشد، بلکه دلیل آن، ارتباط بین این دو متغیر با یک متغیر ثالث باشد. برای مثال، در روزهای برفی و بارانی زمستان، بین پوشیدن پالتو و استفاده از چتر، ضریب همبستگی مثبت وجود دارد. اما بر اساس این همبستگی نه می‌توان گفت که پالتو پوشیدن دلیل استفاده از چتر است، نه استفاده از چتر دلیل پالتو پوشیدن.
  •  4. ضریب همبستگی را نباید به صورت درصد تعبیر کرد.اما مجذور ضریب همبستگی نشان دهندۀ درصد وجه مشترک بین دو متغیر است.
  •  5. هر چه قدر م 5. هر چه قدر مطلق ضریب همبستگی بین دو متغیر بیشتر باشد، مقدار رابطۀ بین آنها بیشتر است . بنابراین، ضریب همبستگی 60/0 + بیشتر از ضریب همبستگی 55/0+ است و ضریب همبستگی 72/0- از هر دو آنها بزرگ تر است. تنها تفاوت بین ضرایب مثبت و منفی در جهت رابطۀ بین متغیرهاست.ضریب همبستگی مثبت نشان دهندۀ رابطۀ مستقیم، اما ضریب همبستگی منفی نشان دهندۀ رابطۀ معکوس است.

ضریب همبستگی دو رشته ای نقطه‌ای

  • زمانی که از دو متغیر مورد نظر که می‌خواهیم بین آنها ضریب همبستگی به دست آوریم یکی پیوسته و دیگری دو مقولگی یا دو ارزشی باشد از روش همبستگی دو رشته‌ای نقطه‌ای استفاده می‌کنیم . منظور از متغیر دو ارزشی آن است که تنها یکی از دو مقدار یک یا صفر را شامل می شود، مانند بله- نه، زن_مرد ، و قبول- رد. معمولا به منظور انجام محاسبات به یکی از این دو مقوله نمره 1 و به یکی نمرۀ صفر(0) داده می‌شود. نمونۀ روشن این نوع نمرۀ گذاری، نمره دادن به سوالهای آزمونهای عینی، مانند آزمونهای چند گزینه‌ای است.در این آزمونها به هر سوال درست نمرۀ 1 و به هر سوال غلط نمرۀ 0 داده می‌شود.
    فرمول محاسبه ضریب همبستگی دو رشته ای نقطه ای که مورد خاصی از ضریب همبستگی گشتاوری است به صورت زیر است:

    ضریب همبستگی

ضریب همبستگی گشتاوری پیرسون

  • متداول ترین روش همبستگی، همبستگی گشتاوری پیرسون است. اگر دو دسته نمرات X و Y برای دو درس داشته باشیم با استفاده از نمرات خام می توان از فرمول زیر ضریب همبستگی را به دست آورد:

    ضریب همبستگی گشتاوری پیرسون

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف