Надежность и длина теста
При конструировании теста полезно уметь определить необходимую его длину, чтобы достичь планируемой надежности теста. С этой целью используется обобщенный вариант формулы Спирмена—Брауна
где k — число раз, в которое увеличивается длина теста; rн — коэффициент надежности теста до увеличения его длины; (rн)' —коэффициент надежности после увеличения длины теста [12].
Конечно, увеличение длины в обсуждаемой постановке проблемы предполагается вести путем добавления заданий, содержание которых основано на той же спецификации, что и исходные задания теста. Таким образом, увеличение длины предполагает не изменение содержательной области, подвергающейся проверке, а детализацию проверки каждого содержательного элемента в тесте. Помимо этого, добавляемые задания должны иметь статистические характеристики, близкие к характеристикам исходных заданий теста. Нарушение одного из этих условий приводит, как правило, к неоправданному завышению оценок надежности теста.
Использование формулы (5.27) легко пояснить с помощью численных данных. Например, если надежность теста была rн=0,7идлину теста увеличили в 3 раза, то надежность нового теста возрастет до
что в отличие rн= 0,7 является вполне приемлемой для профессионального уровня создания теста.
Возможно другое применение формулы (5.77), когда достигнутая надежность, скажем rн=0,7, кажется разработчику явно недостаточной и он хочет узнать, во сколько раз следует увеличить длину для запланированного повышения качества теста. Если достигнутую надежность обозначить символом rдост, а планируемую, т.е. желательную — символом rплан , то
Для рассматриваемого выше примера, где rдост= 0,7, а rплан= 0,88,
Естественно, что надежность теста не является самоцелью, поскольку неоправданное увеличение длины теста, как уже было отмечено ранее, приведет к усталости и снижению мотивации у учеников, что в конечном счете отразится негативно на той же надежности теста. Поэтому при конструировании теста следует искать разумный компромисс, когда надежность теста находится в допустимых пределах, а длина теста выбрана сообразно возрастным особенностям учеников и специфике проверки. К тому же включение большого числа заданий, сходных по содержанию, нецелесообразно при итоговой проверке учеников.
Дата добавления: 2018-11-25; просмотров: 494;