Тема 6. Метод тестирования
Метод тестирования: проблемы стандартизации, норм, надежности и валидности. Методы оценки надежности и валидности тестов. Основные группы тестов, применяемых при отборе персонала.
Обычно принято считать, что систематичная оценка индивидуальных различий с помощью тестов в том виде, в каком мы знаем их сегодня, началась в конце XIX века и развитие индустриально-организационной психологии было тесно связано с развитием тестирования. В этом контексте тестом называется определенная процедура оценки относительного или абсолютного положения индивидуума на некоторой шкале, по которой измеряются физические, психические или поведенческие характеристики. Существует огромное число способов количественной или качественной оценки (то есть тестирования) индивидуальных характеристик и поведения. Для конкретных целей тестирования некоторые способы измерения годятся лучше, чем другие, но в любом случае результаты содержат ошибку измерения.
Измерением называется процесс приписывания значений результатам наблюдений, причем значения приписываются в соответствии с некоторой определенной системой. (Эти значения часто, но не всегда бывают числовыми). Однако точность измерений – это величина относительная. В основе любой деятельности, связанной с психологическими измерениями, лежит предположение о том, что все такие измерения содержат погрешность или ошибку. Можно выделить постоянные ошибки, то есть ошибки, которые одинаково влияют на результаты всех тестируемых и непредсказуемые ошибки, то есть ошибки, в отношении которых заранее неизвестно, возникнет ли подобная ошибка и если возникнет, то на оценку кого из тестируемых она повлияет.
Существуют определенные требования, которым соответствуют научно обоснованные психологические тесты: стандартизация, нормы, надежность и валидность. Следует отметить, что не все, даже широко известные, тесты полностью соответствуют указанным требованиям. Тем не менее существуют эталоны, к которым должны стремиться все тесты, используемые для отбора персонала.
Стандартизация. Под стандартизацией подразумевается единообразие предъявления и обработки теста. Если необходимо сравнить результаты тестирования нескольких кандидатов, то, разумеется, необходимо предусмотреть, чтобы условия тестирования были идентичными для всех. В противном случае любое изменение условий тестирования может поставить одних в невыгодное положение по сравнению с другими. С целью достижения единообразия создатели тестов указывают в руководствах точные процедуры тестирования, касающиеся временных ограничений, устных инструкций, ответов тестируемых на специфические вопросы, форм и бланков, необходимых для прохождения теста, физических условий (например, сидя за столом, условий освещения и т. д.), а также процедуры обработки результатов.
Нормы. Сам по себе результат, полученный в ходе диагностики, мало что скажет об испытуемом. Для того, чтобы интерпретировать эти данные, их надо сравнить с результатами, показанными группой. Это распределение тестовых результатов, полученных на большой выборке лиц, представляющих популяцию аппликантов. Распределение такой группы служит системой отсчета для сравнения результатов, показанных испытуемым.
Надежность. Важной характеристикой теста является его надежность, т. е. способность давать консистентные/непротиворечивые результаты при повторных использованиях. Психологический тест принесет мало пользы, если он при последующем использовании показывает противоречивые результаты. Если при одной и той же процедуре тестирования одни и те же испытуемые показывают противоречивые результаты, то такая процедура не представляет большой ценности для практического использования.
Разумеется, как бы ни были сходны условия проведения тестирования, никакой тест не является идеально надежным. На результаты тестирования всегда оказывают влияние как состояние тестируемых (например, биоритмы, усталость, стресс и т. д.), так и даже незначительные изменения в условиях проведения тестирования (шумы, освещенность, погода и т. д.). Таким образом, перед тем, как использовать тест для отбора персонала, необходимо убедиться в его надежности.
Существует целый ряд методов определения надежности теста. Рассмотрим несколько из них.
Тест-ретест метод. Этот метод предполагает двойное предъявление одного и того же теста одинаковой выборке тестируемых и последующую корреляцию двух распределений. Чем ближе к +1,00 значение полученной корреляции, тем более стабильны показатели теста и больше его надежность.
В методе эквивалентных форм используется тот же подход, что и в методе тест-ретест, однако здесь во второй раз предъявляется не та же, а эквивалентная форма теста, т. е. сходная по всем содержательным характеристикам, но различная по форме и количеству вопросов/заданий.
Метод «двух половинок» связан не столько с временной стабильностью теста, сколько с определением его внутренней консистентности. Для определения надежности с помощью этого метода результаты тестирования искусственно разделяются на два распределения: одно образуется четными вопросами/ заданиями теста, другое нечетными. Затем, определив, в какой мере данные обоих распределений коррелируют между собой, подставляют полученный коэффициент корреляции в формулу Спирмена-Брауна. Указания на величину корреляции в руководстве по использованию теста должны сопровождаться информацией о примененном методе определения надежности.
Валидностъ. В широком смысле валидность свидетельствует о степени соответствия/идентичности измеряемой тестом характеристики самой характеристике. Например, если индивид имеет высокие показатели по интеллектуальному тесту, то этот тест будет считаться валидным только в том случае, если его результаты не противоречат другим проявлениям развитого интеллекта (высоким показателям в учебе, выработке оптимальных решений в трудовой деятельности и т. д.). Если же такой корреляции не будет, а обладатель высокого IQ будет удивлять окружающих своей глупостью, станет очевидно, что тест лишен валидности и, по всей видимости, измеряет вовсе не интеллект, а что-то иное.
Существует несколько видов валидности. С точки зрения задач отбора и подбора персонала наибольший интерес и важность представляют критериальная и содержательная валидность.
Критериальная валидность определяется степенью соответствия (корреляции) тестовых показателей индивида имеющимся показателям его профессиональной деятельности. Различают два типа критериальной валидности: прогностическая валидность и одновременная валидность. Первая из них является наиболее убедительной для целей отбора, поскольку она непосредственно оценивает способность теста прогнозировать последующую деятельность тестируемого. Для оценки прогностической валидности результаты тестирования кандидата перед наймом сравниваются с критериями его профессиональной деятельности впоследствии (например, через год с момента найма). Одновременная валидность определяется предъявлением теста уже работающим работникам и корреляцией тестовых данных с критериями их профессиональной успешности.
Содержательная валидность обычно используется для валидизации тестов достижения. Она включает систематический анализ содержания теста на предмет его адекватности измеряемым навыкам, знаниям и способностям, необходимым в конкретной профессии. Определяется такая валидность на основании суждений экспертов (например, руководства, инженерно-технического персонала и т. д.) о соответствии содержания теста содержанию конкретной профессиональной деятельности. Так, например, экспертам может быть независимо предложено оценить тестовые вопросы/задания на предмет их важности (бесполезности) для конкретной профессиональной деятельности. Рекомендуется, чтобы тесты для отбора и подбора персонала в организации обладали как содержательной, так и критериальной валидностью.
Дата добавления: 2018-03-01; просмотров: 606;