Педагогический тест
В отличие от первых двух определений, довольно инвариантных относительно целей создания тестов, определение педагогического теста ориентировано на конкретные цели и подходы. В частности, для случая оценки итоговых достижений по одной из учебных дисциплин в рамках нормативно-ориентированного подхода определение теста может иметь следующий вид.
Определение 3. Итоговый нормативно-ориентированный тест — это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обеспечивающих информативность оценок уровня и качества подготовки испытуемых.
Предложенное определение отличается от многих других, имеющихся в отечественной и зарубежной литературе. В основном оно предназначено для гомогенного теста, обладающего дисциплинарной общностью заданий, однако с определенными оговорками и дополнениями может быть использовано и для гетерогенного теста, охватывающего систему знаний по нескольким учебным дисциплинам. В последнем случае необходимо изменить требования к характеристикам тестовых заданий. Другой будет и стратегия их упорядочения в тесте. В отличие от гомогенного теста, где задания чаще всего располагаются по нарастанию трудности, в гетерогенных тестах сохранение принципа нарастания трудности выражается, как правило, в так называемой спиральной или ступенчатой форме.
Гетерогенные тесты бывают двух заметно отличающихся друг от друга видов: полидисциплинарные и междисциплинарные [33]. Полидисциплинарные тесты просты в концептуальном отношении и состоят из гомогенных субтестов по отдельным дисциплинам. Сложности, которые здесь возникают, обычно носят исключительно технический характер и связаны с объединением результатов учеников по субтестам для подсчета итоговых баллов по всему полидисциплинарному тесту.
Междисциплинарные тесты гораздо сложнее в концептуальном отношении, но зачастую кажутся проще полидисциплинарных в техническом отношении, особенно на начальном этапе работ по созданию теста. Однако эта кажущаяся легкость оборачивается значительными трудностями, которые нередко становятся непреодолимыми при интерпретации результатов выполнения теста, что приводит к профанации самой идеи междисциплинарной оценки. Сложность интерпретации здесь видится в том, что оцениваемые знания и умения относятся к разным учебным дисциплинам и задействуют их в разной степени.
При правильном подходе междисциплинарность должна найти свое отражение в содержании всех заданий, для выполнения которых потребуется применение некоторых обобщенных, интегративных знаний и умений. Включение в тест междисциплинарных заданий заставляет искать ответ на вопрос: в какой степени разработанные задания пригодны для оценки измеряемых интегративных свойств и насколько они надежны? Обычно ответ на этот вопрос требует довольно серьезных усилий со стороны разработчика теста.
В целом разработка гетерогенных тестов требует обращения к специальным достаточно сложным вопросам репрезентации структуры междисциплинарных знаний математико-статистическими методами многомерного шкалирования и в данном пособии не рассматривается. Обращение к многомерным статистическим методам вынудило бы авторов книги значительно расширить используемый математический аппарат и, несомненно, сузило бы круг заинтересованных читателей. Поэтому вопросы, связанные с гетерогенными тестами, осознанно исключены из рассмотрения.
Возвращаясь к определению гомогенного нормативно-ориентированного теста, необходимо подчеркнуть главную идею — тест образует не любая система заданий, а только та, которая обеспечивает информативные оценки уровня и качества подготовки испытуемых группы. Критерий информативности является ключевым в оценке качества теста, вернее, той грани качества, которая характеризует способность теста выполнять функцию средства измерения в рамках нормативно-ориентированного подхода для данной выборки учеников.
Оценка информативности носит апостериорный характер. Она построена на подсчете дифференцированной ошибки измерения уровня подготовки каждого испытуемого группы и выявлении дифференцирующего эффекта теста. Что касается ошибки измерения, то здесь намечается обратно пропорциональная зависимость, которая не только описывается специальной математической формулой, но и хорошо согласуется с обыденным смыслом. Чем меньше ошибка измерения уровня подготовки каждого испытуемого группы, тем больше информации о знаниях или умениях ученика можно получить с помощью данного теста. Если ошибка измерения, полученная при оценке подготовки испытуемого, велика, то тест не дает информации о реальном уровне его подготовки и, следовательно, цель измерений не достигнута.
Оценка дифференцирующего эффекта связана с анализом распределения тестовых баллов испытуемых группы. Оценка может быть проведена достаточно простым путем визуального анализа гистограммы. Более сложный путь основан на оценке близости эмпирического распределения к нормальному закону с помощью одного из известных критериев нормальности распределения [36]. Если гипотеза о нормальности не подтверждается и тестовые баллы учеников слабо дифференцированы, то тест не состоялся, поскольку не выполняются основные требования нормативно-ориентированного подхода.
Из этих утверждений следуют два важных вывода. Первый — нет и не может быть тестов информативных вообще, так как оценка информативности зависит не только от характеристик тестовых заданий, но и от уровня подготовки тестируемой группы. Второй — для оценки информативности заданий необходимы эмпирические исследования качества теста на репрезентативной выборке учеников. Таким образом, информативность следует рассматривать как меру пригодности теста для выполнения функций средства измерения и дифференциации оцениваемой выборки учеников.
В целом хотелось бы отметить, что в предлагаемом определении выделяется наиболее важное преимущество теста, выгодно отличающее его от традиционных средств оценки знаний учащихся. Это преимущество связано с тем, что только тест является качественным средством педагогического измерения, поскольку именно в отношении тестов утвердилась рефлексивная норма обязательной проверки их качества. Работа над повышением качества теста консолидирует систему тестовых заданий — постепенно нарастает внутренняя связь и целостность, интегративность системы, совершается переход от совокупности предтестовых заданий к профессионально разработанному тесту.
Дата добавления: 2018-11-25; просмотров: 506;