Эмпирические методы валидизации заданий теста

Тестолога, в отличие от педагога, обычно интересуют иные аспекты анализа результатов выполнения теста. Как правило, он стремится к определенным выводам, расставляющим акценты и намечающим приоритеты в работе по созданию и совершенствованию теста. Несомненно, работа начинается с подготовки заданий, содержание которых по возможности ориентировано на оценку значений концептуально выделенной переменной измерения. В большинстве своем задания бывают валидными, особенно в том случае, когда к их разработке привлекались опытные педагоги с большим стажем работы в школе. Однако, как бы то ни было, валидность следует доказать эмпирически на репрезентативной выборке учеников.

По результатам статистической проверки выявляются несостоятельные профили ответов на задания и производится удаление из теста невалидных заданий. Если удаление носит не единичный и случайный, а продуманный и закономерный характер, то в целом качество теста повышается; Происходит консолидация системы тестовых заданий, постепенно нарастает ее внутренняя связность и целостность, повышается интегративность содержания системы заданий с точки зрения их соответствия концептуально выделенной переменной измерения.

От того, насколько хорошо проделана работа по консолидации системы заданий, во многом зависит успех дальнейшего продвижения к этапу использования теста для оценки знаний учеников. И теория, и практика говорят о том, что после завершения работы над тестом большинство профилей учеников будут правильными либо почти правильными, т.е. инвертированными в незначительной степени. Однако и по готовым тестам отдельные ученики, знания которых слабо структурированы, могут показать явно несостоятельные тестовые результаты, которые в любом случае не дают оснований для достоверных выводов об истинных баллах этих отдельных учеников.

Выявление в инвертированных профилях ответов стоящих не на своих местах элементов образует информационную и мотивационную основы для реализации обучающей функции тестового контроля. Благодаря тестам преподаватель получает объективную информацию, столь необходимую для индивидуализации процесса обучения. В зависимости от характера и меры инвертированности профилей ответов учеников принимается решение о необходимости проведения дополнительных занятий и консультаций, о характере помощи неуспевающим ученикам для улучшения качества их знаний. Таким образом, обучение становится эффективным не на словах, а на деле.

Однако эти формальные рассуждения относятся исключительно к ситуации, когда работа над тестом завершена и педагога интересуют только результаты учеников при выполнении теста. В процессе разработки теста нет смысла удерживать в числе результатов несостоятельные профили ответов учеников, поскольку они могут внести серьезные искажения при оценке валидности заданий теста. Конечно, хорошо, когда несостоятельных профилей встречается не более одного-двух на 50—100 человек в группе тестируемых учеников. В противном случае исключение инвертированных профилей без всяких ограничений может негативно отразиться на репрезентативности группы учеников. Поэтому обычно, чтобы избежать различных осложнений с размерами выборки учеников, стараются исключить не более 5% несостоятельных профилей, а все оставшиеся использовать при создании теста.

Нередко кажется, что реализовать определенную последовательность действий в работе с профилями достаточно сложно из-за их взаимной связи и влияния друг на друга. Действительно, изменение состава выборки учеников неизбежно отражается и на изменении меры инвертированности профилей ответов на задания теста. И наоборот, любое удаление невалидных заданий может привести к возникновению новых несостоятельных профилей учеников. Однако трудности эти кажущиеся и носят скорее искусственный, чем явный характер. В основном они порождены попыткой обособленного рассмотрения наблюдаемых результатов выполнения теста, когда профили учеников и заданий анализируются в отрыве друг от друга. На деле профили тесно связаны и проистекают из общего источника, поскольку и профили учеников, и профили заданий являются результатом взаимодействия двух множеств, одно из которых — множество испытуемых, а другое — множество заданий теста.

По мнению Б. Д. Райт (B. D. Wright), взаимодействие множеств является наиболее существенным фактором, лежащим в основе правильного понимания идеи тестовых измерений. В результате взаимодействия появляются те наблюдаемые единицы и нули, по которым оцениваются параметры испытуемых и заданий теста. Идея взаимодействия удачно иллюстрируется с помощью рис. 2.8.

По горизонтальной оси откладываются устойчивые оценки параметра трудности заданий теста, по вертикальной — истинные баллы тестируемых учеников. Взаимодействие между i-м испытуемым с баллом Q_i и j-м заданием с трудностью b_i порождает наблюдаемый ответ Х_ij который при дихотомической оценке принимает одно из двух значений

	1, если ответ i-го ученика на j-е задание правильный
	0, если ответ i-го ученика на j-е задание неправильный

<12 13 141516 17 18 >

Дата добавления: 2018-11-25; просмотров: 458;