Понятие нормы. Проблемы стандартизации показателей.
Одним из основных понятий в психометрике является понятиенормативного оценивания,под которым понимается подходк оценке и интерпретации измеряемых тестом показателей, отражающих какие-либо особенности личности, путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки. По сравнению с альтернативным принципом ипсативного оценивания, нормативное оценивание более распространено. Здесь наиболее полно проявляется измерительный, характер психометрических техник.
Основным достоинством нормативного оценивания является возможность строгого ранжирования испытуемых по результатам относительно выборочных данных, использования метрических шкал интервалов, относительная доступность интерпретации оценок пользователям психодиагностической информации.
Недостаток нормативного оценивания - эмпиричность рассчитываемых показателей, определенная условность перенесения выборочных данных на индивидуальное обследование [3].
Понятие нормы.Из основных понятий нормативного оценивания вытекает другое понятие – понятие нормы. Никакие результаты, полученные с помощью психологических тестов не имеют смысла до тех пор, пока они не будут сравнены с тестовыми нормами, которые возникают в процессе стандартизации нового теста, при прохождении через него большого количества испытуемых, представляющих ту популяцию, для которой данный тест был разработан. Затем полученные данные используются как стандарт для оценки показателей индивидов. Нормы могут быть выражены по-разному, например: как интеллектуальный возраст, как проценты или как стандартные значения, - но все они позволяют психологу определить «положение» испытуемого в выборке стандартизации.
Тестовые нормы - количественные и качественные критерии оценки результатов теста, позволяющие определить уровень достижений или степень выраженности психологических свойств, которые являются объектами измерения. В качестве таких критериев могут выступать как статистические показатели выборки стандартизации, так и различные признаки-симптомы, свидетельствующие о том или ином уровне выраженности диагностируемых качеств.
В психодиагностике наибольшее распространение получили количественные тестовые нормы, рассчитанные на основе определения средних величин х и дисперсии в выборке стандартизации. Количественные тестовые нормы, упорядоченные в шкалы на основе процедур z-преобразования (будут рассмотрены далее), содержатся в специальных таблицах, прилагаемых к руководствам по проведению тестирования. В этом виде тестовые нормы позволяют установить относительное место каждого индивидуального результата по сравнению с выборочными данными, выраженными в долях дисперсии. Такие количественные тестовые нормы наиболее типичны для тестов интеллекта, опросников личностных и др.
В проективных техниках, в связи с затруднениями, возникающими при формализации первичных оценок и вследствие сложности учитываемых диагностических показателей, количественные тестовые нормы мало распространены.
В виде качественных тестовые нормы могут выступить, например, стандартизированные наборы квалификационных требований к испытуемому, аналогичные шкалам умственного развития, либо специально разработанные для конкретного теста комплексы диагностических признаков. Качественные критерии выступают как нормативы, позволяющие отнести индивида к той или иной диагностической группе. Комплексы критериев тестовые нормы могут быть упорядочены в нормативные или порядковые шкалы. Одна и та же психодиагностическая методика может иметь количественные и качественные тестовые нормы, позволяющие взаимодополнить и обогатить интерпретацию результатов.
Для каждой возрастной группы тестовые нормы обычно рассчитываются раздельно (обязательное условие для тестов общих способностей, при этом закономерное изменение нормативных показателей здесь служит своеобразным критерием валидности теста). В клинической психодиагностике, иногда разрабатываются разные тестовые нормы для отдельных контингентов больных (например, для больных разных нозологий и нормальных). Реже встречается дифференциация норм в зависимости от пола, профессиональных особенностей, уровня образования и т. д.
Рестандартизация и определение норм для новой социоэтнической популяции является одним из основных и обязательных элементов адаптациитеста.
Наиболее сложной проблемой определения тестовых норм является отбор и комплектация выборки нормирования. Выборка должна соответствовать по своему объему назначению методики. В психодиагностике действует следующая закономерность: чем более генерализованной (широкой) является область применения теста, тем большим должно быть число испытуемых в нормативной выборке. При этом центральное внимание должно уделяться обеспечению репрезентативностивыборки по отношению к обследуемой тестом популяции. Поясним это положение.
Если ставится задача простого уменьшения погрешности измерения, то для этой цели вполне достаточна выборка стандартизации из 500 испытуемых. Однако, нельзя вынести никакого суждения относительно объема выборки не зная, для какой категории лиц предназначен тест. Если тест, например, рассчитан на общую популяцию старших школьников, то объем выборки стандартизации должен составлять как минимум около 10000 человек. Если тест рассчитан на какую-то специфическую выборку, например, спасателей или водолазов, то объем выборки стандартизации может быть значительно меньше. Можно утверждать, что репрезентативность выборки является более важной характеристикой, чем ее размер.
При одинаковых объемах стратифицированная выборка (выборка, разделенная на страты, классы) более эффективна, чем случайная (рандомизированная). Наиболее частыми критериями стратификации являются: социальное положение, регион проживания, возраст, пол, образовательный уровень и т.д. [3].
Итак, при формировании выборки стандартизации следует учитывать два ее важных фактора: репрезентативность и объем.
Рассмотрим несколько более подробно некоторые виды норм [1, 2].
А) Нормы развития.
Возрастные нормы. Независимо от способа выражения, показатели, основанные на возрастных нормах, довольно грубы и плохо поддаются точной статистической обработке. Тем не менее, они достаточно наглядны, особенно при клиническом обследовании, а также при решении ряда научных проблем.
Умственный возраст. Возрастные нормы используются и в тестах, не подразделенных на возрастные уровни (например, шкалы Бине-Симона). В этом случае нормы устанавливаются для значений первичного результата теста, такого, как общее число правильных ответов, время выполнения заданий, число ошибок или же некоторая комбинация таких показателей. Значения первичных результатов, полученных на выборке стандартизации для каждого возрастного уровня, и составляют возрастные нормы такого теста. Например, средний показатель 8-летних детей является нормой для возраста 8 лет. Если показатель обследуемого равен среднему значению первичного результата для этого возраста, то его умственный возраст составляет 8 лет. Подобным образом могут быть выражены любые первичные показатели такого теста.
Эквивалентный класс. Показатели тестов достижений в обучении часто интерпретируются с помощью понятия эквивалентный класс, введение которого объясняется тем, что все тесты этого типа применяются для обследования учащихся. Например, говорят, что ученик достиг уровня VII класса по орфографии, уровня VIII класса по технике чтения и уровня V класса по арифметике. Подобная характеристика оказывается такой же наглядной, как и умственный возраст в тестах интеллекта. Нормы классов определяются подсчетом среднего первичного результата, полученного детьми соответствующего класса. Так, если среднее количество правильно решенных задач арифметического теста в выборке стандартизации четвероклассников равно 23, то число 23 соответствует эквивалентному IV классу. Промежуточные эквивалентные классы, представляющие как бы доли класса, обычно определяются путем интерполяции, хотя их можно получить и непосредственно, тестируя детей несколько раз в учебном году.
Несмотря на популярность, классные нормы имеют ряд недостатков. Во-первых, содержание обучения меняется от класса к классу. Поэтому такие нормы применимы только к общеобразовательным предметам, обучение которым ведется на всех уровнях, охватываемых данным тестом.Во-вторых, они неприменимы в старших классах, где многие предметы изучаются только один или два года. Даже если предмет преподается на протяжении всего обучения в школе, его значение может меняться от класса к классу и, следовательно, скорость его изучения может быть различной. Иными словами, единицы шкал эквивалентных классов явно не равны друг другу, причем отсутствует определенная закономерность в их изменении для разных предметов.
Шкалы порядка. Другой подход к нормам развития связан с исследованиями по детской психологии. Наблюдения за развитием младенцев и дошкольников дали обширный материал, позволяющий описать типы поведения для различных актов по таким функциям, как моторика, сенсорика, речевое общение, формирование понятий. Например, можно отразить по месячный уровень развития ребенка (в каждой из четырех основных сфер его поведения: моторики, языка, адаптивного и личностно-социального поведения) в специально составленных таблицах развития.
Шкалы, разработанные по этим данным, являются шкалами порядка по тому, что этапы развития наступают в определенной последовательности, причем каждый новый этап предусматривает предварительное усвоение типов поведения, характерных для предыдущих этапов.
В целом, шкалы порядка предназначены для выяснения того, на какой стадии развития находится та или иная конкретная психическая функция. Слово «порядок», входящее в название данного типа шкал, указывает на существование единообразия в развитии, проходящем через последовательные стадии.
Дата добавления: 2016-04-02; просмотров: 946;