Виды тестовых шкал

1.Первичные оценки («сырые баллы»).

А) Указывают на количество ответов, котрые совпали с ключом.

Б) Не указывают на место испытуемого в популяции (нормативной выборке) по измеряемому свойству.

В) Используются в методиках с качественной интерпретацией, проэктивных методиках, а также в методиках, которые используются в исследовательских целях ( а не целях обследования)

2. Шкальные оценки. (стандартные тестовые баллы). Используются для установления места испытуемого на специальной стандартной шкале, которая содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации.

Наиболее распространены следующие стандартные шкалы:

А) Шкала стенов. Диапазон значений: от 1го до 10-ти. Образуется через создание интервалов путём прибавления-отнятия половины величины стандарного отклонения от среднего, полученных в выборке стандартизации (М ± 0,5σ). Пример методик: (16-ти факторный личностный опросник Кеттлла, Опросник УСК)

Б) Z-шкала. Диапазон значений: от -4 до +4 значений стандартного отклонения при среднем значении «0». Такая шкала может быть получена путем перевода каждого значения случайной величины в значение, представляющее собой отношение разности данного значения со средним к стандартному отклонению распределения:

В таком случае, среднее арифметическое будет равняться нулю, а основная масса значений окажется в пределах от –1 до +1. Поэтому, в отношении каждого значения можно сказать – редкое оно в данном распределении или частое, и в какую сторону от среднего находится – в большую, или в меньшую.

В) Т-шкала. Если умножить z-оценку на 10 и прибавить к ней константу равную 50, то получим шкалу с диапазоном от10-ти до 90-та с диапазоном средних значений признака от 40 до 60-ти.

ТЕМА 4. НАДЁЖНОСТЬ

4.1. Определение надёжности.

Надёжность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.

Надёжность (в широком смысле) – это характеритсика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой степени они могут быть приписаны случайным ошибкам.

Надёжность (в узком методическом смысле ) – степень согласованности результатов, получаемых при первичном и вторичном его применении у одних и тех же испытуемых в различные моменты времени (Словарь-справочник по психодиагностике).

"Надежность" в современном понимании — это родовое понятие, включающее в себя несколько видов, и каждый вид имеет свой особый смысл.

Источники нарушения надёжности (По Гуревич):

А) Нестабильность диагностируемого свойства.

Б) Несовершенство диагностических методик (небрежно составлена инструкция,задания по своему характеру разнородны, нечетко сформулированы указания попредъявлению методики испытуемым и т.д.).

В) Меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т.д.).

Г) Различия в манере поведения экспериментатора (от опыта к опыту по-разномупредъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.).

Д) Колебания в функциональном состоянии испытуемого (в одном экспериментеотмечается хорошее самочувствие, в другом — утомление и т.д.).

Е) Элементы субъективности в способах оценки и интерпретации результатов (когдаведется протоколирование ответов испытуемых, оцениваются ответы по степениполноты, оригинальности и т.п.).

4.2. Расчёт надёжности по формуле Рюлона.

А) Есть два способа проверки надёжности двух эквивалентных половин теста: С помощью коэфициента корреляции и по формуле Рюлона.

Б) Нужно разделить вопросы (пункты) теста(шкалы) на 2 равные по количеству пунктов половины случайным образом (например, чётные вопросы – в одну группу, а нечётные – в другую.

В) Затем посчитать дисперсию разностей результатов одной и другой половины.

Г) Затем посчитать дисперсию всего теста (шкалы)

Д) Затем полученные значения подставить в следующую формулу:

Где: S_d – дисперсия различий результатов каждого испытуемого по первой и второй половине;

S_х – дисперсия результатов всего теста.

Формула расчёта дисперсии:

Чем выше значение r, тем выше показатель надёжности теста. Минимальное удовлетворительное значение r =0,7

4.3. Виды надёжности.

1. Индекс сложности заданий (пунктов). Показывает частоту встречаемости ответов, совпадающих с ключём. Таких ответов по каждому пункту в нормативной выборке должно быть не менее 20% и не более 80%. В противовном случае пункт признаётся непригодным, поскольку он недостаточно хорошо дифференцирует испытуемых. Идеальное соотношение ответов: 50% на 50%.

4. Индекс дискриминативности заданий. Обозначает степень (силу) связи каждого пункта с итоговым показателем. Расчитываватся как коэфициент корреляции пункта с итоговым показателем. Чем выше значение коэфициента, тем лучше пункт «вписывается» в соответствующую шкалу. Минимальное допустимое значение = 0,2. В противном случае делается вывод, что этот пункт измеряет какое-то другое свойство, не имеющее отношения к разрабатываемой шкале.

3. Ретестовая нажёжность. На одной и той же выборке проводят диагностику с помощью одного и того же теста с интервалом от 2-х недель до полугода. Различия в полученных результатах должны быть минимальными. Процедура сравнения результатов производится с помощью корреляционного анализа. Чем выше полученное значение коэфициента корреляции, тем надёжней (устойчивей во времени) признаётся методика. Минимальное допустимое значение = 0,7. В противном случае методика(шкала) признаётсянедостаточно надёжной.

4. Надёжность частей теста. Методика (шкала) разбивается на 2 равные по количеству вопросов половины. Затем с помощью корреляционного анализа сравнивают, насколько схожими являются их результаты. Чем выше полученное значение коэфициента корреляции, тем надёжней признаётся методика. Минимальное допустимое значение = 0,7. В противном случае методика(шкала) признаётсянедостаточно надёжной. Альтернативный метод здесь – расчёт надёжности по формуле Рюлона.

5. Внутренняя согласованность.Основной метод проверки и расчёта внутренней согласованности (гомогенности) методики – коэфициент Альфа Кронбаха. Он расчитывается по формуле:

Где: - Сумма дисперсий для отдельных вопросов (пунктов)

- Дисперсия по всему тесту.

Минимальным удовлитворительным значение для альфа Кронбаха = 0,6. В противном шлучае шкала признаётся несогласованной (негомогенной).

ТЕМА5. ВАЛИДНОСТЬ.

<3 4 567 8 9 >

Дата добавления: 2015-09-21; просмотров: 3486;