Актуальность технического обслуживания 18 страница
16.2. Они могут быть определены по длине перпендикуляра, восстановленного из точки на оси X, где способности равняются 1,0, до точки его пересечения с характеристической кривой задания. Существует вероятность, равная приблизительно 0,85, что кто-либо, имеющий такие способности, будет правильно выполнять задание, уровень трудности которого равен 0, вероятность 0,15, что он будет правильно выполнять задание, уровень трудности которого 2,0, и вероятность, равная 0,03, что он правиль-
16.3."
но выполнит задание, уровень трудности которого 3,0. Вероятность того, что он правильно выполнит задание, уровень трудности которого равен 1,0, будет составлять 0,5, по определению, поскольку трудность задания — это точка на шкале способностей,-расположенная на полпути вверх по склону графика, которая, в данном случае соответствует вероятности, равной 0,5.
Задание Дискриминация Трудность
0,5 1,0 2,0
О
О 1,0
ПРОБЛЕМЫ ТЕСТОВ
>бщая картина
В этой главе рассматриваются некоторые проблемы, связанные с тем, что может оказывать воздействие на оценки, получаемые по тестам способностей и личности: общая ситуация, установки по отношению к тестированию и т.д. Особенное внимание уделяется утверждению, что психологические тесты искажают данные не в пользу различных меньшинств. В начале главы дается представление о природе ошибок теста и методах их выявления.
Главы, рекомендуемые для предварительного чтения
11, 13 и 16.
ведение
Не вызывает сомнения, что психологические тесты представляют общественно значимую проблему, поскольку и в популярных изданиях, и в психологических журналах выражались серьезные сомнения по поводу «беспристрастности» различных психологических тестов. Например, Кэмин (Kamin, 1974) привлекает наше внимание к способу использования некоторых ранних тестов способностей, применявшихся в США в 1920-е гг. для выявления «слабоумных» иммигрантов. Вместо того чтобы тестировать абстрактное мышление, эти тесты включали задания, оценивающие фактические знания в области американской культуры (например, надо было назвать бывших президентов США). Неудивительно, что иммигранты (многие из которых не могли даже читать или гово-
рить по-английски и имели очень мало знаний о культуре нации на другой стороне земного шара) оказывались не в состоянии показать по этим тестам свои подлинные способности. Такое тестирование было несправедливым к представителям других культур, поскольку сильно недооценивало их подлинный потенциал.
Когда тесты систематически недооценивают или переоценивают подлинные оценки групп индивидуумов, про них говорят, что они вносят искажения против (или в пользу) определенных групп. Тесты интеллекта, о которых говорит Кэмин, вне сомнения, занижали показатели интеллекта всех тех, кто не говорил по-английски бегло и/или имел мало знаний об американском образе жизни. Члены этих групп получали оценки по тестам, которые не отражали их полного потенциала. Отметьте, однако, что искажение было обнаружено в этом случае благодаря способу использования теста: кто-то где-то отобрал тест, не подходящий для данной задачи. Тест, используемый в этом примере, мог оказаться совершенно адекватным в других случаях, например, для применения в школе или в психологии труда, где языковые различия не составляют проблему. Следовательно, важно подчеркнуть, что смещение оценок может возникнуть из-за неправильного выбора в других условиях вполне адекватного теста, хотя и сами тесты могут также иметь недостатки.
Когда мы рассматривали теорию надежности в главе 13, было признано, что каждая индивидуальная оценка по тесту имеет ту или иную ошибку измерения. В соответствии с изложенной там моделью корень квадратный из показателя надежности теста представляет близкую апроксимацию корреляции между оценкой индивидуума по тесту и его «подлинной оценкой» по анализируемой черте. Решающее допущение, сделанное при этом, заключается в том, что ошибка измерения имеет, по существу, случайный характер. Если испытуемый выполняет несколько тестов, измеряющих одну и ту же черту, один тест может слегка переоценить его показатели, другой — слегка недооценить их, но в среднем тесты обеспечат точную оценку способностей человека. В этой главе мы рассмотрим не случайные, а, напротив, систематические ошибки измерения — тип ошибок, которые будут постоянно завышать подлинные показатели одних индивидуумов и занижать подлинные показатели других. Иммиграционный тест будет сильно занижать интеллектуальные способности некоторых четко определен-ных групп соискателей (тех, кто не может читать по-английски и ничего не знает об американской культуре). Нетрудно придумать
много хитрых вопросов, которые также внесут ошибку, особенно в тестах, базирующихся на знаниях, например: «Сколько игроков в команде по нетболу?», «Каково соотношение муки и жира в песочных пирожных?», «Каково назначение распределительного вала?», «Каково соотношение цемента и песка в строительном растворе для кладки кирпича?»
Подобные типы ошибок измерения могут оказывать воздействие не только на вопросы, адресующиеся к тривиальным знаниям. Когда школьные психологи тестируют детей, возможно ли, что на успешность при выполнении теста будет влиять пол/возраст/раса психолога? Что можно сказать о мотивации, побуждающей к успешному выполнению теста? Совершенно очевидна необходимость установить, могут ли какие-либо из этих переменных влиять на успешность детей; иначе говоря, могут ли в подобных случаях переоцениваться или недооцениваться способности детей? В оставшейся части этой главы будут упомянуты некоторые из таких источников ошибки измерения, указано их значение и предложены возможные способы их выявления.
Тот факт, что некоторые группы дают различающиеся оценки по некоторым психологическим тестам, имеет особое значение для тех, кто использует такие тесты как часть процедуры отбора. Применение этих тестов будет, очевидно, вести к тому, что группа (группы) с более низкими средними оценками по тесту будет недостаточно представлена среди работающих. Это заставило некоторые учреждения отказаться от использования психологических тестов как части процедуры отбора, предпочитая вместо этого произвольно выбирать подходящих по квалификации индивидуумов. В то время как произвольный отбор, вероятно, обеспечит выбор индивидуумов, которые репрезентативны всем группам соискателей, он явно не способен обеспечить выбор лучшего кандидата для работы. Поскольку тесты способностей имеют часто коэффициенты валидности порядка 0,4, это может означать, что организации будут просто отсеивать при приеме на работу большинство способных соискателей.
Поэтому, вероятно, лучше всего не отвергать психологические тесты совсем, а оценить проблемы (иногда деликатные), создаваемые групповыми различиями и систематической ошибкой теста при использовании и интерпретации его результатов, хотя некоторые авторы (например, Rust, Golombock, 1989) имеют более пессимистический взгляд на это.
На показатели тестов может влиять не только принадлежность к определенной социокультурной группе. Психологические или поведенческие характеристики, которые совершенно не связаны с тем, что тест измеряет, могут влиять на результаты тестирования, особенно в личностных тестах. Они часто обозначаются как «установки ответов» или «искажения ответов», и, чтобы минимизировать их эффекты при разработке или использовании тестов должны быть предприняты определенные усилия.
Внешние смещения в тестах
В своем обсуждении тестов способностей Кэмин упускает из виду то обстоятельство, что свойственные тестам проблемы должны были быть выделены, когда (и если) тесты валидизировались. Если бы оценки по тестам коррелировали с последующими критериями (например, годовым доходом, школьной успеваемостью детей), бесполезность тестов неизбежно быстро стала бы очевидной. Например, прослеживающие исследования могли выявить связь такого типа, как показана на рис. 17.1, иллюстрирующем гипотетический годовой доход иммигрантов (обозначен кружками) и американцев второго поколения (обозначен крестиками), который они имели 10 лет спустя после тестирования интеллекта, как функцию их тестовых оценок.
На рис. 17.1 вы можете заметить, что большинство иммигрантов имели очень низкие показатели по тесту IQ, их оценки находятся в левой части графика. Крестики представляют второе поколение американцев, и видно, что имеется существенная положительная корреляция между показателями интеллекта и доходом только у этих индивидуумов.
На рисунке представлена «линия наилучшего соответствия» данным для второго поколения американцев, вычисленная с использованием статистического метода, называемого регрессионным анализом. Он позволяет предсказать — на основе тестовых оценок интеллекта индивидуумов второго поколения — их последующий годовой доход. Просто нужно найти точку на оси X, которая соответствует оценке человека по тесту IQ, и установить вертикаль до пересечения с линией регрессии. Оцениваемый годовой доход индивидуума можно будет установить по значению на оси Y, соответствующему этой точке.
Рис. 17.1. Гипотетическая связь между оценками по тестам интеллекта и годовым доходом двух групп индивидуумов спустя 10 лет после тестирования.
Если бы этот тест был справедлив и для иммигрантов, можно было бы ожидать выявления такой же скрытой взаимосвязи. Последнее означает, что если показатель IQ важен для размеров последующего дохода (как оказывается в группе второго поколения), то низкий IQ иммигрантов должен был бы означать, что в последующем они будут зарабатывать относительно мало. Оценки интеллекта иммигрантов должны были бы находиться близко к той же линии регрессии, что и для большинства группы. Вы можете видеть, что на самом деле это далеко не так. Иммигранты, которые имели низкие оценки по тестам интеллекта, обнаруживают тенденцию зарабатывать намного больше денег, чем следовало бы ожидать на основе регрессионного анализа, и если вы будете рассматривать только группу иммигрантов, то можете обнаружить отсутствие корреляции между их оценками по тесту интеллекта и последующим доходом, что едва ли удивительно, если учесть малую информативность теста IQ для членов этой группы.
Задание для самопроверки 17.1
Попытайтесь обработать некоторые данные, нанеся на график доход как функцию показателя IQ двух групп людей, где (а) имеется такая же существенная связь между доходом и показателем IQ для обеих групп, обозначаемых «кружки» и «крестики», но где
группа «кружков» имеет тенденцию к более низким показателям IQ и к более низким доходам;
(б) имеется также существенная связь между доходом и показателем 10 для групп «кружков» и «крестиков», но все члены групп «крестиков» имеют годовой доход, который на 2000 долларов выше, чем доход группы «кружков».
На первом графике, полученном в ответ на задание 17.1, демонстрируется очень важный принцип. Здесь имеются четкие групповые различия в оценках IQ (оценки группы кружков ниже), но члены этой группы также и зарабатывают меньше. Это дает основание предполагать, что существуют истинные различия в оценках IQ кружков и крестиков, и поскольку кружки достигают низких показателей по тесту IQ, этот график (в отличие от рис. 17.1) показывает, что тест IQ, по-видимому, дает адекватную оценку их потенциалу.
Важный вывод, который следует извлечь из этого, состоит в том, что существование групповых различий не обязательно подразумевает, что тест имеет "смещение. Это утверждение не может считаться слишком сильным — оно фундаментально и имеет почти всеобщее признание специалистов по измерению (например, Jensen, 1980; Berk, 1982; Reynolds, 1995). Смещение оценок теста означает, что его задания слишком трудны для членов определенных групп по причинам, не связанным с оцениваемыми характеристиками, например, потому, что задания в тесте IQ требуют умения читать и писать по-английски или обладать знаниями в области чужой культуры, которых недавний иммигрант просто не будет иметь. Между способностями разных групп могут существовать и подлинные различия. Например, имеется обширная литература, посвященная половым различиям в успешности обучения.
Если линии регрессии между тестовыми оценками и критерием успешности одинаковы для двух групп, существование различий в сред не групповых показателях не имеет значения*. Заключение о наличии смещения можно сделать, когда разные группы описываются разными уравнениями регрессии (различающимися либо по наклону, либо по высоте) или когда оценки членов одной группы располагаются дальше от линии регрессии, чем оцен-
* Если принимается, что критерий «справедлив* сам по себе. В случае с иммигрантами мы должны были бы допустить, что им были предоставлены такие же многочисленные возможности зарабатывать, обеспечивая себе большой доход. как и другой группе американцев.
ки членов другой группы (например, если имеется низкая корреляция с критериями). Использование теста, имеющего низкую надежность, автоматически вызывает больший разброс показателей по обе стороны от линии регрессии, поэтому по ней можно также судить о том, насколько совпадает надежность теста в обеих группах. Некоторых психологов особенно интересуют групповые различия черт личности и способностей (как правило, расовые различия), которые рассматриваются как подлинные эффекты и не могут быть приписаны ошибкам любого рода. Так, мы читаем, что японцы, как правило, имеют уровень пространственных способностей выше среднего по сравнению с европейцами, а черные американцы склонны иметь более низкие показатели по IQ, чем белые американцы. Ссылок на эти работы я не даю преднамеренно, потому что, откровенно говоря, для меня в этой области нет академической фундаментальности. Даже если четкие различия между группами имеются, совершенно не ясно, почему они возникают. Японцы имеют лучшие навыки потому, что они едят больше рыбы; потому, что их система образования развивает такие навыки лучше, чем западная; потому, что существуют генетические различия, или потому, что они должны были охотиться для добывания пищи во время ледникового периода и, следовательно, на эту характеристику действовал естественный отбор (хотя странно, что объектом отбора не стала способность к быстрому бегу)? Все перечисленное может быть представлено как возможные варианты объяснения групповых различий, и проверить любую из этих гипотез (особенно последнюю) непросто.
Можно также легко увлечься идеей групповых различий и забыть, что индивидуальные различия внутри групп людей намного превышают относительно небольшие различия между группами. Политические опасности доктрины групповых различий, расовой неполноценности и т.п. вряд ли могут остаться незамеченными. Наконец, существует проблема того, как следует поступать, решая, какие группы сравнивать, поскольку каждый из нас является членом огромного числа групп. Нас можно классифицировать по полу, возрасту, религиозным убеждениям, социальной принадлежности, музыкальным вкусам, сексуальной ориентации, цвету волос, телосложению и т.д., и было бы вполне возможно исследовать каждый из этих вариантов на предмет существования групповых различий. Однако полезно ли это делать? Что будет означать, если мы обнаружим, например, что рыжеволосые лесбиян-
ки более социабельны, чем рыжеволосые женщины гетеросексуальной ориентации? Насколько это продвинет вперед развитие теории психологии? Мне кажется, что это будет просто фактом, не представляющим большого теоретического интереса.
Тем не менее цвет кожи и пол обладают странной привлекательностью для некоторых психологов. Практические психологи также должны осознавать последствия признания групповых различий в способностях при использовании тестов отбора. Хотя выше я утверждал, что групповые различия совсем не обязательно предполагают, что тест имеет смещения, официальная система занимает противоположную позицию и придерживается той точки зрения, которую Клайн (Kline, 1993) называет «эгалитаристским заблуждением». Этот принцип предполагает, что все этнические и половые группы должны иметь одинаковые базовые уровни всех способностей, и если тесты дают основания для других заключений, то с этими тестами, должно быть, что-то не в порядке. Поэтому, используя тесты для отбора персонала, необходимо быть уверенным в том, что они практически свободны от влияния групповых различий.
Задание для самопроверки 17.2
Выше в этой главе подчеркивалось, что неправильно считать, будто тест имеет смещение просто потому, что он обнаруживает групповые различия. Предположим, что вы предъявляете тест, чтобы отобрать соискателей для определенной работы, и находите, что какой-либо конкретный тест достаточно хорошо предсказывает деловую успешность (г = 0,3), но обнаруживаете, что оценки мужчин-соискателей заметно ниже, чем оценки женщин-соискателей (например, на половину стандартного отклонения).
(а) Что произойдет, если тест будет использоваться в таком виде?
(б) Какие непсихологические факторы могут объяснить наблюдаемые между полами различия в успешности?
(в) Какие шаги можно предпринять?
Внутренние смещения в тестах
Тип смещения, описанный выше, называется внешним смещением, поскольку при этом исследуется связь между тестовыми оценками и некоторым внешним критерием. Однако совсем не
обязательно иметь внешний критерий, чтобы выявить факт смещения тестовых оценок, поскольку возможно, что тест может включать несколько заданий, которые по содержанию явно направлены против одной или более групп. Другими словами, они могут оказаться существенно более трудными для членов одних групп по сравнению с другими. Для того чтобы выделять такое «внутреннее смещение», было разработано несколько методов, а Остерлинд (Osterlind, 1983) и Бек (Berk, 1982) представили превосходное обсуждение этих проблем. Я упомяну только два подхода.
Представим себе, что много людей выполняют тест способностей, и каждый ответ оценивается как правильный или неправильный. Этих индивидуумов можно классифицировать как членов одной или более групп (например, соответственно полу или этнической принадлежности). Чтобы упростить изложение, мы сконцентрируемся только на половых различиях и допустим, что тест состоит из 50 заданий. Можно реализовать смешанную модель (между- и внутри-) анализа вариативности тестовых оценок, используя «пол» (два признака) как межиндивидуальный фактор, а «задания» (50 уровней) — как внутрииндивидуальный фактор. Таким образом, мы обрабатываем ответы на все 50 заданий теста, рассматривая их как различные уровни одного внутри индивидуального фактора. Таблица, полученная в результате применения метода ANOVA в этом анализе, будет показывать значимость:
• эффекта «задания»;
• эффекта «группы»;
• эффекта «взаимодействия группа х задание».
Эффект «задания» определяет, все ли задания теста имеют одинаковый уровень трудности. Почти определенно они не будут одинаково трудны, поэтому обычно можно гарантировать, что этот член действительно будет очень важным. Однако этот компонент дисперсии не представляет никакого особого интереса для выделения смещения.
Эффект «группы» говорит о том, в какой степени мужчины и женщины склонны иметь одинаковые средние показатели по заданиям теста. Он также не вызывает большого интереса, хотя присутствие существенных групповых различий будет представлять проблему, если кто-то намеревается использовать тест для отбора или распределения.
Действительно интересным является эффект «взаимодействия
группа х задание». Если он статистически значим, это означает, что некоторые задания являются более легкими для одной группы, чем для другой. Иными словами, распределение оценок по некоторым заданиям смещено. Можно точно обнаружить такие задания, нанося на график эффекты взаимодействия, проверяя простые эффекты и т.д. Затем они могут быть удалены из теста. Таким образом, констатация значимого «взаимодействия группа х х задание» может указать на то, что некоторые элементы теста проблематичны.
Этот подход имеет одну трудность, состоящую в том, что мощность статистической процедуры влияет на оценку значимости данного взаимодействия. На практике это означает, что, если анализ выполняется на небольшой группе людей, маловероятно, что удастся выделить слабую степень смещения. Однако если выборки включают тысячи индивидуумов, будет видно, что почти каждое задание обнаруживает статистически значимую (хотя и небольшую) степень смещения. Для полноты картины мне следует признать, что, как известно, этот подход имеет некоторые проблемы, упоминаемые Остерлиндом (Osterlind, 1983) наряду с другими, хотя, на мой взгляд (и по моему опыту), он может способствовать выявлению задания со значительной степенью смещения.
Второй метод обнаружения внутренних смещений базируется на принципах теории сложности заданий, обсуждаемой в главе 16. Предположим, что параметры задания устанавливаются по каждому из них отдельно для испытуемых-мужчин и испытуемых-женщин и наносятся на график в виде характеристической кривой задания (ХКЗ). Если задание не обнаруживает смещений, устанавливаемые параметры способностей, дискриминации и угадывания должны быть в конечном счете идентичны для мужской и женской выборок. Другими словами, две характеристические кривые задания должны точно совпадать друг с другом. Очевидно, что совсем не тот случай изображен на рис. 17.2. Здесь задания, по-видимому, оказались значительно более легкими для женщин, чем для мужчин, особенно в случаях, когда способности индивидуумов находятся в интервале от —1 до 3. Чтобы количественно оценить смещение параметров задания, могут быть использованы такие статистики, как площадь между двумя характеристическими кривыми. Все это оказывается несколько более сложным, чем кажется вначале (поскольку целесообразно учитывать точность, с которой оцениваются параметры задания, т.к. от нее зависит на-
Рис. 17.2. Характеристические кривые, демонстрирующие параметры одного и того же задания теста у мужчин и женщин.
дежность утверждений, что оно имеет смещение). Другая проблема возникает при использовании трехпараметрической модели. Величина параметра «с» (параметр «угадывание», или «псевдослучайность», определяющий значение, при котором график выравнивается в левой части) в действительности должна быть одинаковой в обеих группах, в противном случае площадь между двумя графиками становится неопределяемой (Raju, 1988). Преимущество исследования смещений таким способом состоит в том, что можно выделить весьма слабые эффекты.
Задание для самопроверки 17.3
Как бы вы интерпретировали вариант смещения, показанный на характеристической кривой задания, представленной на рис. 17.3?
Я считаю, что целесообразно рассматривать внутренние (присущие самому заданию) смещения во всех случаях разработки и использования теста. Представим себе, например, что тест, состоящий из 40 заданий, включал 20 заданий, которые были намного
: легче для женщин, чем для мужчин, и 20 заданий, которые были намного легче для мужчин, чем для женщин. Если просто искать
г значимые различия в общих оценках двух групп, вполне возмож-
Рис. J7.3. Характеристическая кривая задания, демонстрирующая сравнительно более сложный вариант смешения.
но, что ничего не будет обнаружено, поскольку задания, трудные для мужчин, являются легкими для женщин, и наоборот. Таким образом, тест вполне может быть насыщен заданиями, содержащими смещения, но анализ групповых различий или регрессионный анализ будет при этом оценивать шкалу в целом как вполне удовлетворительную (см. рис. 17.1). Только обращаясь к уровню отдельных заданий, можно действительно увидеть, что происходит, и выделить задания, которые, вероятно, было бы полезно удалить из шкалы.
Что бы ни говорили инструкции к тестам, люди делают весьма странные вещи при выполнении личностных тестов. Если бы вы взяли шкалы Айзенка и Уилсона, то могли бы получить подтверждение этому. Эти характеристики известны как «смещения ответа», или «установки на ответ», поскольку они описывают способы, которыми индивидуумы склонны решать оценочные задания. Например, хорошо известно, что люди с большей вероятностью склонны соглашаться с утверждениями, чем не соглашаться с
ними, — это в полном объеме эксплуатируется недобросовестными исследователями рынка. Представим себе, что тщательно отобранной выборке из людей вы задали вопрос: «Намереваетесь ли вы голосовать за существующее правительство на следующих выборах?» — и обнаружили, что 55% ответили положительно. Затем другой выборке вы задали вопрос: «Намереваетесь ли вы голосовать за одну из оппозиционных партий на следующих выборах?» Вы можете наивно полагать на основе первого опроса, что около 100 — 55 = 45% людей дадут положительный ответ. В действительности пропорция, вероятно, будет значительно выше, просто потому, что люди более склонны говорить «да», чем «нет», независимо от того, какой вопрос им задан (Cronbach, 1946). Это называется установкой на молчаливое согласие.
Этот факт имеет некоторые весьма неприятные последствия при тестировании персонала. Он означает, что в любой личностной шкале, например, в шкале тревоги, где все задания обрабатываются по одной и той же схеме (таким образом, что ответ «да» или «совершенно согласен» обеспечивает высокие показатели по тесту), оценки будут подвержены влиянию «молчаливого согласия». Они будут несколько выше, чем они должны были бы быть благодаря склонности людей соглашаться с утверждениями. По-видимому, каждый окажется более тревожным, чем он есть на самом деле. Само по себе это, может быть, и не является слишком большой проблемой. Если бы можно было установить, что в среднем оценка каждого человека была на два балла выше, чем следовало бы из-за установки на ответ, было бы достаточно просто вычесть это число из оценки каждого индивидуума. На практике не было бы особой необходимости беспокоиться и прибегать к этой процедуре, поскольку корреляции между тестовыми оценками и другими характеристиками не будут меняться в результате вычитания постоянной величины из оценки каждого человека. Тогда в чем же проблема?
Настоящие трудности возникают, если существуют индивидуальные различия в установке на молчаливое согласие. Может быть, некоторые индивидуумы имеют сильную тенденцию соглашаться с утверждениями, в то время как другие полностью свободны от такой установки. Именно это и представляет особую опасность, поскольку оценки индивидуумов по тесту тревожности будут испытывать на себе влияние как самой тревожности, так и склонно-сти соглашаться. Очевидно, тест будет переоценивать показатели
тревожности для индивидуумов, склонных к молчаливому согласию, и в то же время будет совершенно точно характеризовать людей, не имеющих подобной склонности. Именно поэтому большинство личностных тестов содержит утверждения, которые обрабатываются по противоположным направлениям. Если около 50% утверждений формулируется таким образом, что согласие с утверждением предусматривает высокий показатель по черте (например, «я страдаю от нервозности»), а остальная часть формулируется в противоположном ключе («большую часть времени я спокоен и расслаблен»), молчаливое согласие будет оказывать небольшой эффект. При обработке теста любая тенденция к молчаливому согласию будет благодаря этому нейтрализована. К тестам, сконструированным не таким способом, следует относиться с осторожностью. Другой «стиль ответа», который может оказывать воздействие на то, каким образом люди отвечают на утверждения теста, — социальная желательность. Это склонность показывать себя в лучшем свете и отвергать любые варианты поведения и чувств, которые могут быть социально неприемлемы. Утверждения, касающиеся сквернословия, таких свойств, как скупость, агрессивность, наличие чувства юмора, честность, трудолюбие и понятливость, находятся среди тех, на которые может оказывать влияние социальная желательность. Она представляет особую проблему, когда личностные тесты используются для отбора персонала; любой, кто имеет хотя бы чуточку разума, осознает, что при приеме на работу, вероятно, не слишком уместно признаваться в том, что у него случаются галлюцинации, что он нечестен и неряшлив при заполнении личностного опросника и т.п.
Социальную желательность нетрудно измерить. Можно попросить ранжирующих тщательно изучить утверждения в личностных опросниках и решить, в какой степени каждое утверждение подвержено действию социальной желательности. В случаях хорошего согласия между ранжирующими высоковероятно, что социальная желательность будет влиять на вариант ответа, Эдварде (Edwards, 1957) провел такой эксперимент и обнаружил, что имелась существенная корреляция между рангами социальной желательности каждого утверждения в тесте и выбираемым вариантом ответа: люди имеют тенденцию отвечать на вопросы в социально желательной форме.
Как и в случаях молчаливого согласия, это создает серьезные трудности только в том случае, если мы признаем, что одни люди
в большей степени, "чем другие, подвержены социальной желательности, при заполнении личностных опросников. К сожалению, редко удается использовать то же решение для социальной желательности (уравновешивание вопросов теста таким образом, чтобы некоторые социально желательные вопросы имели тенденцию увеличивать оценку по черте, в то время как другие — уменьшать ее). Можете ли вы придумать задание теста, измеряющего тревожность, где вопрос на высокий уровень тревожности оказывается также и более социально желательным по сравнению с вопросом, говорящим о низком уровне тревожности? Поэтому в обычной практике пытаются просто устранить из личностных опросников в процессе их разработки утверждения, уровень социальной желательности которых высок.
Дата добавления: 2015-03-03; просмотров: 803;