Внимание — проблема. Объективность теста
В литературе по индустриально-организационной психологии встречается множество определений, а также несколько сложных статистических моделей объективности теста (например, Anastasi, 1989;Millsap&Everson, 1993; Sackett&Wilk, 1994). Однако суть вопроса можно сформулировать довольно просто. Согласно теории необъективности теста, «даже при условии равенства коэффициентов валидности для групп меньшинств и для группы большинства тест скорее всего является необъективным, если средний результат для групп меньшинств ниже» (Schmidt & Hunter, 1981).
Шмидт и Хантер, более того, отмечают, что теория необъективности теста базируется на предположении о том, что каузальные факторы, которыми обусловлены низкие результаты тестирования групп меньшинств, не связаны с выполнением работы. Хотя некоторые исследователи обнаружили, что различия в выполнении работы меньше, чем различия в результатах тестов (например, Ford, Kraiger & Schechtman, 1986), предположение о том, что результаты тестирования не связаны с выполнением работы, противоречит основной массе фактов.
Выполнение работы зависит от многих факторов. Однако в целом различия в способностях и навыках, выявляемые с помощью тестов, связаны с различиями в выполнении работы так же, как они связаны с различиями в школьной успеваемости (Neisser et al., 1990); они существуют на самом деле, а не появляются за счет «необъективных» тестов. Это означает, что тесты, выявляющие такие различия, выполняют задачу, для которой они были предназначены — оценивают различия между работниками. Производящиеся «во имя справедливости» попытки разработать и использовать такие тесты, благодаря которым эти различия исчезнут, приведут к тому, что тестирование станет бесцельным и бесполезным.
Многие из тех, кто борется с проблемами, осложняющими использование тестов в организациях, считают, что идеи об объективности и необъективности тестов породили серьезную путаницу в некоторых важных вопросах. Многие люди в нашей стране не имеют образовательного и культурного опыта, который обычно связывают с более высокими результатами тестирования (или не сумели им воспользоваться). Это факт, который невозможно изменить никакими сложными исследованиями валидности тестов или юридическими спорами, и любые направленные на это усилия приводят только к бесполезным затратам ценных ресурсов.
Тесты сами по себе не являются ни объективными, ни необъективными. Они просто более или менее хорошо измеряют те характеристики, для измерения которых они предназначены; другими словами, они более или менее надежны и валидны. В результате некоторые из них с большей вероятностью, чем другие, могут быть использованы необъективно. Работа над совершенствованием тестов и методов их использования не должна быть, да и не будет прекращена. Но гарантия равенства возможностей еще не означает гарантии равенства результатов; те, кто критикует отборочные тесты за то, что результаты некоторых групп менее предсказуемы, чем результаты других групп, просто походят к серьезной социальной проблеме не с того конца.
Выводы
Измерение — это приписывание оценок результатам наблюдений в соответствии с определенной системой, такой как, например, тест. Основными критериями оценки адекватности теста как измерительного инструмента являются надежность (постоянство результатов измерений) и валидность (обоснованность выводов, полученных из результатов теста).
Процесс оценки надежности и валидности может быть длительным и дорогостоящим; исследователи могут столкнуться с различными ситуационными трудностями и ограничениями. Современные аналитические методы позволяют переносить доказательства валидности некоторых видов тестов, установленные для одной работы, на другие виды работ; благодаря такой возможности рассмотренные выше стандартные тесты, используемые при приеме на работу, становятся значительно более привлекательными для организаций с ограниченными ресурсами.
Вопросы для повторения и обсуждения
1. Дайте описание трех измерительных инструментов, не упомянутых в этой главе, и приведите по одному примеру возможных источников измерительной погрешности для каждого инструмента.
2. Если бы вас попросили измерить рост всех студентов вашей группы и дать оценку надежности ваших измерений, как бы вы это сделали?
3. Допустим, что вы с коллегами разработали новый тест. Первые исследования надежности не дали многообещающих результатов, поэтому вы решили не тратить времени зря и перейти сразу к проверке валидности теста. Обсудите эту ситуацию.
4. Сформулируйте несколько фраз, демонстрирующих ваше понимание сущности различий между конструктными, критериальными и содержательными доказательствами валидности.
5. Что означает термин «генерализация валидности» и почему генерализация валидности считается важным достижением индустриально-организационной психологии?
Дата добавления: 2015-09-07; просмотров: 1072;