Виды тестовых шкал
1.Первичные оценки («сырые баллы»).
А) Указывают на количество ответов, котрые совпали с ключом.
Б) Не указывают на место испытуемого в популяции (нормативной выборке) по измеряемому свойству.
В) Используются в методиках с качественной интерпретацией, проэктивных методиках, а также в методиках, которые используются в исследовательских целях ( а не целях обследования)
2. Шкальные оценки. (стандартные тестовые баллы). Используются для установления места испытуемого на специальной стандартной шкале, которая содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации.
Наиболее распространены следующие стандартные шкалы:
А) Шкала стенов. Диапазон значений: от 1го до 10-ти. Образуется через создание интервалов путём прибавления-отнятия половины величины стандарного отклонения от среднего, полученных в выборке стандартизации (М ± 0,5σ). Пример методик: (16-ти факторный личностный опросник Кеттлла, Опросник УСК)
Б) Z-шкала. Диапазон значений: от -4 до +4 значений стандартного отклонения при среднем значении «0». Такая шкала может быть получена путем перевода каждого значения случайной величины в значение, представляющее собой отношение разности данного значения со средним к стандартному отклонению распределения:
В таком случае, среднее арифметическое будет равняться нулю, а основная масса значений окажется в пределах от –1 до +1. Поэтому, в отношении каждого значения можно сказать – редкое оно в данном распределении или частое, и в какую сторону от среднего находится – в большую, или в меньшую.
В) Т-шкала. Если умножить z-оценку на 10 и прибавить к ней константу равную 50, то получим шкалу с диапазоном от10-ти до 90-та с диапазоном средних значений признака от 40 до 60-ти.
ТЕМА 4. НАДЁЖНОСТЬ
4.1. Определение надёжности.
Надёжность – характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов.
Надёжность (в широком смысле) – это характеритсика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой степени они могут быть приписаны случайным ошибкам.
Надёжность (в узком методическом смысле ) – степень согласованности результатов, получаемых при первичном и вторичном его применении у одних и тех же испытуемых в различные моменты времени (Словарь-справочник по психодиагностике).
"Надежность" в современном понимании — это родовое понятие, включающее в себя несколько видов, и каждый вид имеет свой особый смысл.
Источники нарушения надёжности (По Гуревич):
А) Нестабильность диагностируемого свойства.
Б) Несовершенство диагностических методик (небрежно составлена инструкция,задания по своему характеру разнородны, нечетко сформулированы указания попредъявлению методики испытуемым и т.д.).
В) Меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т.д.).
Г) Различия в манере поведения экспериментатора (от опыта к опыту по-разномупредъявляет инструкции, по-разному стимулирует выполнение заданий и т.д.).
Д) Колебания в функциональном состоянии испытуемого (в одном экспериментеотмечается хорошее самочувствие, в другом — утомление и т.д.).
Е) Элементы субъективности в способах оценки и интерпретации результатов (когдаведется протоколирование ответов испытуемых, оцениваются ответы по степениполноты, оригинальности и т.п.).
4.2. Расчёт надёжности по формуле Рюлона.
А) Есть два способа проверки надёжности двух эквивалентных половин теста: С помощью коэфициента корреляции и по формуле Рюлона.
Б) Нужно разделить вопросы (пункты) теста(шкалы) на 2 равные по количеству пунктов половины случайным образом (например, чётные вопросы – в одну группу, а нечётные – в другую.
В) Затем посчитать дисперсию разностей результатов одной и другой половины.
Г) Затем посчитать дисперсию всего теста (шкалы)
Д) Затем полученные значения подставить в следующую формулу:
Где: Sd – дисперсия различий результатов каждого испытуемого по первой и второй половине;
Sх – дисперсия результатов всего теста.
Формула расчёта дисперсии:
Чем выше значение r, тем выше показатель надёжности теста. Минимальное удовлетворительное значение r =0,7
4.3. Виды надёжности.
1. Индекс сложности заданий (пунктов). Показывает частоту встречаемости ответов, совпадающих с ключём. Таких ответов по каждому пункту в нормативной выборке должно быть не менее 20% и не более 80%. В противовном случае пункт признаётся непригодным, поскольку он недостаточно хорошо дифференцирует испытуемых. Идеальное соотношение ответов: 50% на 50%.
4. Индекс дискриминативности заданий. Обозначает степень (силу) связи каждого пункта с итоговым показателем. Расчитываватся как коэфициент корреляции пункта с итоговым показателем. Чем выше значение коэфициента, тем лучше пункт «вписывается» в соответствующую шкалу. Минимальное допустимое значение = 0,2. В противном случае делается вывод, что этот пункт измеряет какое-то другое свойство, не имеющее отношения к разрабатываемой шкале.
3. Ретестовая нажёжность. На одной и той же выборке проводят диагностику с помощью одного и того же теста с интервалом от 2-х недель до полугода. Различия в полученных результатах должны быть минимальными. Процедура сравнения результатов производится с помощью корреляционного анализа. Чем выше полученное значение коэфициента корреляции, тем надёжней (устойчивей во времени) признаётся методика. Минимальное допустимое значение = 0,7. В противном случае методика(шкала) признаётсянедостаточно надёжной.
4. Надёжность частей теста. Методика (шкала) разбивается на 2 равные по количеству вопросов половины. Затем с помощью корреляционного анализа сравнивают, насколько схожими являются их результаты. Чем выше полученное значение коэфициента корреляции, тем надёжней признаётся методика. Минимальное допустимое значение = 0,7. В противном случае методика(шкала) признаётсянедостаточно надёжной. Альтернативный метод здесь – расчёт надёжности по формуле Рюлона.
5. Внутренняя согласованность.Основной метод проверки и расчёта внутренней согласованности (гомогенности) методики – коэфициент Альфа Кронбаха. Он расчитывается по формуле:
Где: - Сумма дисперсий для отдельных вопросов (пунктов)
- Дисперсия по всему тесту.
Минимальным удовлитворительным значение для альфа Кронбаха = 0,6. В противном шлучае шкала признаётся несогласованной (негомогенной).
ТЕМА5. ВАЛИДНОСТЬ.
Дата добавления: 2015-09-21; просмотров: 3473;