МЕТОД РАСЩЕПЛЕНИЯ ТЕСТА (ОДНОКРАТНОЕ ТЕСТИРОВАНИЕ)

Метод расщепления на две части (split-half method) наиболее распространен из-за своего удобства. Он позволяет вычислить коэффициент надежности при однократном выполнении учениками теста. Для оценки надежности результаты тестирования делят на две части: в одну включают данные испытуемых по четным, а в другую — по нечетным заданиям теста. Правда, деление на две части — не единственный способ, возможны и другие варианты, когда выделяют большее число частей при оценке надежности теста.

Результаты учеников заносят в табл. 5.31 и получают табл. 5.32.

Далее для таблицы данных используют формулу (5.74), в которой роль результатов в первом тестировании выполняют данные по четным заданиям, а во втором — по нечетным.

Таблица 5.31. Сводная таблица для оценки надежности (метод расщепления)

Номер ученика »	Балл при первом тестировании X,	Балл при втором тестировании Y,	X_iY_i	(X_i)²	(Y_i⁾²
	X₁	Y₁	X₁Y₁	(X₁)²	(Y₁)²
	X₂	Y₂	X₂Y₂	(X₂)²	(Y₂)²

N	X_n	Y_n	X_nYn	(X_n)²	(Y_n)²
	СУММА (X_i)	СУММА (Y_i)	СУММА(X_iY_i)	СУММА (X_i)²	СУММА (Y_i)²

Для матрицы табл. 5.28 результаты по четным и нечетным заданиям приводятся в табл. 5.32.

После подстановки чисел из табл. 5.32 в формулу (5.74) получается

По сравнению с прежним значением 0,78 надежность получилась намного меньше, что можно было предвидеть, поскольку подсчет методом расщепления велся не по 10 заданиям, а только по 5. Для оценки надежности исходного теста из 10 заданий используется формула Спирмена—Брауна

Таблица 5.32. Подсчет надежности (метод расщепления)

Номер ученика 1°	Балл при первом тестировании X,	Балл при втором тестировании Y,	Х,У,	(*У	(I?










Сумма

Тогда r_n теста из 10 заданий будет

После коррекции коэффициент надежности получился приблизительно такой же, как и в предыдущем случае подсчета ретестовым методом (г_н =0,78). Применение формулы Спирмена— Брауна подтверждает высказанное ранее предположение: увеличение длины повышает надежность теста.

Рассмотренный выше метод расщепления основан на допущении параллельности двух половин теста, что не всегда и не в полной мере может оказаться верным. Корреляция двух половин возрастает по мере роста гомогенности теста. В этой связи метод расщепления нередко называют методом оценки внутренней состоятельности (согласованности) теста (Internal-Consistency Method).

Следующий подход к оценке надежности основан на вполне реальных данных и не зависит от упомянутых выше искусственных допущений о полной параллельности частей теста.

Однако и он имеет свою ограниченную сферу применения, поскольку годится исключительно для гомогенных тестов.

метол кьюаера— ричардсона (аля дихотомических ouehok по заданиям теста)

Формула Кьюдера— Ричардсона (F. Kuder, M. Richardson 20, или KR-20) имеет вид [48]

где р_j — доля правильных ответов на j-е задание; q_j — доля неправильных ответов, qj= 1 –p_j, S_x² —дисперсия по распределению наблюдаемых баллов; п — число заданий теста.

Применительно к рассматриваемой матрице S_x² =6,89 (см.

разд. 5.2), a p_j(j= 1,2,..., 10) приводится в самой последней строчке табл. 5.27. Тогда

Результат подсчета коэффициента надежности по формуле (5.76) довольно близок к двум другим полученным ранее (0,76 и 0,78).

Из обсуждения должно быть понятно, что не может быть какого-либо единственного показателя, доказывающего по оценке своих значений приемлемую надежность теста. Для полной ее проверки следует учитывать несколько показателей надежности, подсчитанных по разным формулам, лишь небольшая часть которых приведена в данном тексте.

В качестве нижнего предела допустимых значений надежности обычно выбирают 0,7. При более низком значении использование теста вряд ли целесообразно в силу большой погрешности измерения. Если тест разрабатывают профессионалы, то к нему предъявляют более жесткие требования. Как правило, тесты с надежностью менее 0,8 считаются непригодными в профессионально организованных службах тестирования и центрах. Значения коэффициента надежности, превышающие 0,9, говорят о высоком качестве теста. Они крайне желательны, но редко встречаются. Как правило, в тестологической практике надежность тестов колеблется в интервале (0,8; 0,9).

Положение с выводами о качестве теста осложняется тем, что нет и не может быть раз и навсегда определенной надежности теста. Ситуация вполне объяснимая, поскольку коэффициент надежности, подсчитываемый по матрице тестовых результатов, всегда зависит от свойств выборки испытуемых. Поэтому при каждом очередном использовании теста приходится оценивать его надежность, а уж потом говорить о достоверной интерпретации результатов выполнения теста.

В целом надежность зависит от ряда характеристик теста, рассмотрение которых может способствовать повышению качества теста в процессе его создания.

<63 64 656667 68 69 >

Дата добавления: 2018-11-25; просмотров: 2316;