Тема 6. Метод тестирования

Метод тестирования: проблемы стандартизации, норм, надежности и валидности. Методы оценки надежности и валидности тестов. Основные группы тестов, применяемых при отборе персонала.

Обычно принято считать, что систематичная оценка индивидуальных различий с по­мощью тестов в том виде, в каком мы знаем их сегодня, началась в конце XIX века и развитие индустриально-организационной психологии было тесно связано с развити­ем тестирования. В этом контексте тестом называется определенная процедура оценки относительного или абсолютного положения индивидуума на некоторой шкале, по которой измеряются физические, психические или поведенческие характеристики. Существует огромное число способов количественной или качественной оценки (то есть тести­рования) индивидуальных характеристик и поведения. Для конкретных целей тестирования некоторые способы измерения годятся лучше, чем другие, но в любом случае результаты содержат ошибку измерения.

Измерением называется процесс приписывания значений результатам наблюде­ний, причем значения приписываются в соответствии с некоторой определенной си­стемой. (Эти значения часто, но не всегда бывают числовыми). Однако точность измерений – это величина относительная. В основе лю­бой деятельности, связанной с психологическими измерениями, лежит предположе­ние о том, что все такие измерения содержат погрешность или ошибку. Можно выделить постоянные ошибки, то есть ошибки, которые одинаково влияют на результаты всех тестируемых и непредсказуемые ошибки, то есть ошибки, в отношении которых заранее неизвестно, возникнет ли подобная ошибка и если возникнет, то на оценку кого из тестируемых она повлияет.

Существуют определенные требования, которым соответствуют на­учно обоснованные психологические тесты: стандартизация, нормы, надежность и валидность. Следует отметить, что не все, даже широко известные, тесты полностью соответствуют указан­ным требованиям. Тем не менее существуют эталоны, к которым долж­ны стремиться все тесты, используемые для отбора персонала.

Стандартизация. Под стандартизацией подразумевается единооб­разие предъявления и обработки теста. Если необходимо сравнить ре­зультаты тестирования нескольких кандидатов, то, разумеется, необходимо предусмотреть, чтобы условия тестирования были идентичными для всех. В противном случае любое изменение условий тестирования может поставить одних в невыгодное положение по сравнению с други­ми. С целью достижения единообразия создатели тестов указывают в ру­ководствах точные процедуры тестирования, касающиеся временных ог­раничений, устных инструкций, ответов тестируемых на специфические вопросы, форм и бланков, необходимых для прохождения теста, физи­ческих условий (например, сидя за столом, условий освещения и т. д.), а также процедуры обработки результатов.

Нормы. Сам по себе результат, полученный в ходе диагностики, мало что скажет об испытуемом. Для того, чтобы интерпретировать эти данные, их надо сравнить с результатами, показанными группой. Это распределение тестовых результатов, полученных на боль­шой выборке лиц, представляющих популяцию аппликантов. Распределение такой группы служит системой отсчета для сравнения результатов, по­казанных испытуемым.

Надежность. Важной характеристикой теста является его надежность, т. е. способность давать консистентные/непротиворечивые результаты при повторных использованиях. Психологи­ческий тест принесет мало пользы, если он при последующем использо­вании показывает противоречивые результаты. Если при одной и той же процедуре тести­рования одни и те же испытуемые показывают противоречивые результа­ты, то такая процедура не представляет большой ценности для практического использования.

Разумеется, как бы ни были сходны условия проведения тестирова­ния, никакой тест не является идеально надежным. На результаты тес­тирования всегда оказывают влияние как состояние тестируемых (на­пример, биоритмы, усталость, стресс и т. д.), так и даже незначительные изменения в условиях проведения тестирования (шумы, освещенность, погода и т. д.). Таким образом, перед тем, как использовать тест для отбора персонала, необходимо убедиться в его надежности.

Существует целый ряд методов определения надежности теста. Рас­смотрим несколько из них.

Тест-ретест метод. Этот метод предполагает двойное предъявление одного и того же теста одинаковой выборке тестируемых и последую­щую корреляцию двух распределений. Чем ближе к +1,00 значение полученной корреляции, тем более стабильны показатели теста и больше его надежность.

В методе эквивалентных форм используется тот же подход, что и в методе тест-ретест, однако здесь во второй раз предъявляется не та же, а эквивалентная форма теста, т. е. сходная по всем содержательным харак­теристикам, но различная по форме и количеству вопросов/заданий.

Метод «двух половинок» связан не столько с временной стабильностью теста, сколько с определением его внутренней консистентности. Для определения надежности с помощью этого метода результаты тестирования искусственно раз­деляются на два распределения: одно образуется четными вопросами/ заданиями теста, другое нечетными. Затем, определив, в какой мере дан­ные обоих распределений коррелируют между собой, подставляют по­лученный коэффициент корреляции в формулу Спирмена-Брауна. Указания на величину корреляции в руководстве по использованию теста должны сопровож­даться информацией о примененном методе определения надежности.

Валидностъ. В широком смысле валидность свидетельствует о степе­ни соответствия/идентичности измеряемой тестом характеристики самой характеристике. Например, если индивид имеет высокие показатели по интеллектуальному тесту, то этот тест будет считаться валидным только в том случае, если его результаты не противоречат другим проявлениям развитого интеллекта (высоким показателям в учебе, выработке опти­мальных решений в трудовой деятельности и т. д.). Если же такой корреляции не будет, а обладатель высокого IQ будет удивлять окружающих своей глупостью, станет очевидно, что тест лишен валидности и, по всей видимости, измеряет вовсе не интеллект, а что-то иное.

Существует несколько видов валидности. С точки зрения задач отбора и подбора персонала наибольший интерес и важность представляют кри­териальная и содержательная валидность.

Критериальная валидность определяется степенью соответствия (корреляции) тестовых показателей индивида имеющимся показателям его профессиональной деятельности. Раз­личают два типа критериальной валидности: прогностическая валидность и одновременная валидность. Первая из них является наиболее убеди­тельной для целей отбора, поскольку она непосредственно оценивает способность теста прогнозировать последующую деятельность тести­руемого. Для оценки прогностической валидности результаты тестиро­вания кандидата перед наймом сравниваются с критериями его профес­сиональной деятельности впоследствии (например, через год с момента найма). Одновременная валидность определяется предъявлением теста уже работающим работникам и корреляцией тестовых данных с критери­ями их профессиональной успешности.

Содержательная валидность обычно используется для валидизации тестов достижения. Она включает систематический анализ содержания теста на предмет его адекватности измеряемым навыкам, знаниям и способностям, необходимым в конкретной профессии. Определяется такая валидность на основании суждений экспертов (например, руковод­ства, инженерно-технического персонала и т. д.) о соответствии содер­жания теста содержанию конкретной профессиональной деятельности. Так, например, экспертам может быть независимо предложено оценить тестовые вопросы/задания на предмет их важности (бесполезности) для конкретной профессиональной деятельности. Рекомендуется, чтобы тесты для отбора и подбора персонала в организации обладали как со­держательной, так и критериальной валидностью.








Дата добавления: 2018-03-01; просмотров: 606;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.005 сек.