Стандартизація, надійність та валідність тесту

Розглянемо поняття стандартизації, надійності та валідності тесту з позицій класичної емпірико-статистичної теорії. Відповідно до цієї теорії конструювання тестів для зміни психологічних властивостей і станів засноване на шкалі інтервалів. Виміряна психічна властивість вважається лінійною і одномірною. Передбачається також, що розподіл сукупності людей, що володіють даною властивістю, описується кривої нормального розподілу.

В основі психологічного тестування лежить класична теорія похибки вимірювань. Вважається, що тест – такий же вимірювальний прилад, як будь-який фізичний прилад, і результати, які він показує, залежать від величини властивості у досліджуваного, а також від самої процедури вимірювання. Будь-яка властивість психіки має «істинний» показник, а показання по тесту відхиляються від істинного на величину випадкової похибки. На показники тесту впливає і «систематична» похибка, але вона зводиться до додавання (вирахування) константи до «істинної» величини параметра, що для інтервальної шкали значення не має.

Надійність тесту. Якщо тест проводити багато разів, то середнє значення буде характеристикою «істинної» величини параметра. Під надійністю тесту прийнято розуміти стійкість результатів до впливу випадкових факторів, зовнішніх і внутрішніх. Найбільш часто проводиться оцінка ретестової надійності. Чим тісніше корелюють результати початкового і повторного (за звичай відстроченого на кілька місяців) проведення тесту, тим він надійніший.

Передбачається, що існує необмежена кількість завдань, які можуть «працювати» на властивість, яка вимірюється. Тест є лише вибірка завдань з їх генеральної сукупності. В ідеалі можна створити скільки завгодно еквівалентних форм тесту, тому визначення надійності тесту можна провести шляхом кореляції паралельних форм або еквівалентних рівних частин, отриманих шляхом розщеплення тестового завдання на дві частини. Оскільки в реальному тесті число завдань обмежене (не більше 100), то оцінка надійності тесту завжди приблизна. Тест вважається надійним, якщо коефіцієнт кореляції результатів становить не менше 0,75.

Валідність тесту. Проблемі валідності в класичній теорії тесту приділяється багато уваги, однак теоретично вона ніяк не вирішується. Валідність означає придатність тесту вимірювати ту властивість, для вимірювання якої він призначений. Отже, чим більше на результат виконання тесту або окремого завдання впливає властивість, яка вимірюється і чим менше інші змінні (у тому числі зовнішні), тим тест валідніший.

Тест валідний (і надійний), якщо на його результати впливає лише властивість, яка вимірюється. Тест невалідний (і ненадійний), якщо результати тестування визначаються впливом не релевантних змінних (релева́нтність (англ. relevance) – міра відповідності отримуваного результату бажаному).

Існують наступні види валідності тесту.

Очевидна валідність. Тест вважається валідним, якщо у досліджуваного складається враження, що він вимірює те, що повинен вимірювати.

Конкретна валідність (конвергентна – дивергентна валідність). Тест повинен добре корелювати з тестами, що вимірюють конкретну властивість або близьке йому за змістом, і мати низькі кореляції з тестами, що вимірюють завідомо інші властивості (конвергентна валідність – властивість декількох показників (мір) одного й того ж поняття приводити до одного і того ж результату).

Прогностична валідність. Тест повинен корелювати з віддаленими за часом зовнішніми критеріями.

Змістовна валідність. Тест повинен охоплювати всю область досліджуваної поведінки.

Конструктна валідність. Передбачає повний опис вимірюваної змінної, висунення системи гіпотез про зв'язки її з іншими змінними, емпіричне підтвердження (не спростування) цих гіпотез.

З теоретичної точки зору єдиним способом встановлення «внутрішньої» валідності тесту і окремих завдань є метод факторного аналізу (і аналогічні), який дозволяє: а) виявляв латентні (приховані) властивості і обчислювати значення «факторних навантажень» – коефіцієнти детермінації властивостей тих чи інших поведінкових ознак; б) визначати міру впливу кожної латентної властивості на результати тестування.

Стандартизація тесту полягає у приведенні процедури оцінок до загальноприйнятих нормативам. Стандартизація передбачає перетворення нормальної або штучно нормалізованої шкали первинних оцінок в шкальні оцінки. Тестові норми, отримані в ході стандартизації, являють собою систему шкал з характеристиками розподілу тестового бала для різних вибірок. Вони не є «внутрішніми» властивостями тесту, а лише полегшують його практичне застосування.

<41 42 434445 46 47 >

Дата добавления: 2015-10-09; просмотров: 1195;