Генерализация валидности
В самом широком смысле под генерализацией валидности подразумевают возможность распространения выводов, сделанных из эмпирического исследования валидности, на другие выборки и условия. Такая генерализация необходима в большинстве случаев использования тестов в прикладных целях; условия тестирования редко бывают идентичны тем, при которых были собраны исходные данные о валидности. Однако в литературе по индустриально-организационной психологии этот термин все чаще используется в более узком смысле. Говоря конкретнее, генерализацией валидности (Validity generalization, VG) называют распространение или перенос критериальных доказательств валидности теста, продемонстрированных для одного вида работы, на другие виды работ без проведения отдельных исследований валидности.
Комиссия по соблюдению равных прав на труд (Equal Employment Opportunity Commission) считает законной генерализацию критериальных доказательств валидности, полученных для конкретной должности, применительно к другим должностям при условии возможности продемонстрировать, что работа в других должностях требует «в основном одних и тех же видов производственного поведения» (ЕЕОС, 1978, Раздел 7В). Демонстрация начинается с анализа работы — то есть с процесса деления работы на поведенческие компоненты с целью выяснения фактического характера деятельности людей, выполняющих эту работу.
Часто в результате такого анализа выясняется, что работа на должностях с совершенно разными названиями, таких как должности банковского кассира и служащего бюро обслуживания, на самом деле требует от выполняющих ее людей примерно одинаковых видов поведения на производстве. Тест, валидность которого была доказана для отбора сотрудников на одну должность, можно законно использовать для отбора сотрудников на другую должность — но будет ли он эффективен в таком случае? Можно ли эффективно прогнозировать успешность работы человека в качестве продавца, выписывающего счета в отделе запасных частей большой авторемонтной мастерской, с помощью того же теста, который использовался для прогнозирования успешности работы продавца, выписывающего счета в спокойной обстановке дорогого универмага? Виды производственного поведения очень похожи, но условия работы сильно отличаются.
Предположение о том, что контекст, в котором выполняется работа (ситуация), настолько важен, что он влияет на возможность прогнозирования успешности работы, называют гипотезой о ситуационной специфичности. При таком подходе получается, что продавец в отделе запчастей и продавец в универмаге выполняют похожую, но все-таки разную работу. С практической точки зрения это означает, что для каждой Должности, для которой тест может быть использован в качестве основы для прогнозов, следует проводить отдельное исследование валидности, даже если анализ работы показывает, что в должностные обязанности входят очень похожие задачи.
Большинство индустриально-организационных психологов в течение многих лет разделяли гипотезу о ситуационной специфичности, и казалось, что имеется множество фактов, ее подтверждающих. Когда одни и те же тесты использовались для прогнозирования выполнения одной и той же или похожих видов работы в различных компаниях (или даже в различных подразделениях одной и той же компании), полученные коэффициенты валидности изменялись в широком диапазоне. Казался неизбежным вывод о том, что условия работы действуют как опосредующая переменная, оказывая влияние на связь между предсказывающей переменной и критерием. Например, по оценке Брауна (Brown, 1981), при прогнозировании выполнения работы тентами по страхованию жизни более трети различий объясняется влиянием различий в условиях их работы.
Для переноса валидности теста, предназначенного для отбора при приеме на работу, с одной
рабочей ситуации на другую необходимо продемонстрировать, что обе эти работы требуют «в
основном одних и тех же видов производственного поведения».
С начала семидесятых годов некоторые исследователи начали внимательнее изучать гипотезу о ситуационной специфичности. С помощью новой методики метаанализа они исследовали такой вопрос: не возникают ли кажущиеся значимыми различия в коэффициентах валидности, полученных для различных ситуаций, на самом деле просто за счет методов и процедур, использованных при сборе и анализе данных? Другими словами, эти различия могут быть «статистическим артефактом», а не истинным явлением. В одном из первых исследований Перлмэн, Шмидт и Хантер (Pearlman, Schmidt & Hunter, 1980) провели повторный анализ данных около 700 исследований валидности прогнозов для должностей канцелярских работников и пришли к выводу, что истинные коэффициенты валидности, полученные в различных исследованиях и в различных ситуациях, как правило, сохраняли постоянство.
Дата добавления: 2015-09-07; просмотров: 926;