Задание для самопроверки 7.1 12 страница

В этой истории содержится важное положение. Даже если на­бор заданий, по-видимому, образует целостную шкалу, невозможно сказать, что именно она измеряет, просто просмотрев задания. Необходимо эмпирически определить, что именно измеряет шка­ла, с помощью процедуры, известной как валидизация теста.

Говорят, что тест валиден, если он измеряет то, что он должен измерить либо в теоретических понятиях, либо в практическом приложении. Например, тест, который предлагается использовать как средство измерения тревожности в общей популяции Вели­кобритании, должен измерять тревожность, а не социальную

желательность, навыки чтения, социабельность или какую-либо другую не связанную с ней черту. Тест, использующийся для про­фотбора соискателей, которые будут с наибольшей вероятностью успешны в определенной деятельности, должен быть способен вы­явить индивидуума (индивидуумов), который будет работать луч­ше других. Однако, если надежность теста может быть выражена определенным числом (для конкретной выборки испытуемых), валидность теста также зависит и от целей тестирования. Напри­мер, тест, валидный для отбора компьютерных программистов из выборки студентов Великобритании, может оказаться бесполез­ным для отбора администраторов в сфере торговли. Тест, валид­ный для измерения депрессии при использовании его медицинс­кими работниками, скорее всего не будет валиден при общем об­следовании нанимающихся на работу соискателей, поскольку большинство из них будут понимать цель теста и искажать свои ответы.

Из этого следет, что надежность является необходимым усло­вием валидности теста, поскольку низкая надежность подразуме­вает, что тест не измеряет одну конкретную черту. Однако высокая надежность сама по себе не гарантирует валидность теста, посколь­ку, как показано выше, это зависит полностью от того, как, поче­му и на ком используется тест.

Существует четыре главных способа установления валидности теста.

Очевидная валидность

Очевидная валидность просто оценивает, насколько тест внеш­не соответствует тому, для чего он предназначался. Описанное выше ниспровержение шкалы R—S показывает, что даже внима­тельное изучение содержания заданий не дает гарантий того, что тест будет измерять именно предполагавшуюся черту. Несмотря на это, некоторые широко распространенные тесты (особенно в со­циальной психологии) конструируются путем формулирования не­скольких заданий, обеспечения достаточной величины коэффи­циента альфа (что обычно не создает проблем, потому что задания перефразируют одно другое), а также наивного полагания, что шкала измеряет то понятие, для оценки которого она предназна­чалась. Принципиально важно до использования теста обеспечить ему лучшие, чем эти, основания.

Содержательная валидность

Иногда можно сконструировать тест, который должен быть ва­лиден, по определению. Например, представьте себе, что кто-то захотел сконструировать тест на правописание. Поскольку, по оп­ределению, словарь содержит полный набор заданий, любая про­цедура, обеспечивающая репрезентативную выборку слов из сло­варя, должна быть валидным тестом способности к правописа­нию. Именно это и означает валидность по содержанию. Приведем другой пример: психологи, специализирующиеся на отборе кад­ров, в некоторых случаях используют особые подходы, условно обозначаемые как «рабочая корзина», когда соискателям предла­гают выполнить ряд работ, которые относятся к сфере професси­ональной деятельности, а затем тем или иным способом оцени­вается их успешность по этим заданиям. Эти эксперименты не являются психологическими тестами в прямом смысле слова, но можно согласиться с тем, что эта процедура имеет содержатель­ную валидность. Проблема заключается в том, что редко удается достаточно точно определить полный набор потенциальных зада­ний теста. Например, каким образом следовало бы определить задания, которые нужно включить в тест способности к вычисле­ниям? В результате этого данная методика используется не слиш­ком часто.

Конструктная валидность

Один из полезных способов проверки того, действительно ли тест измеряет то, что он должен измерить, — проведение продуман­ных экспериментов. Представим себе, что тест предназначен для из­мерения тревожности студентов университетов Великобритании. Как можно проверить его валидность с помощью эксперимента?

Первый подход, иногда называемый «конвергентная валиди-зация», состоит в том, чтобы проверить, связаны ли тестовые оценки с другими показателями, как ожидается. Например, если в арсенале методик имеются другие широко используемые тесты тревоги, группе студентов могут быть предъявлены оба теста и полученные ряды оценок подвергнуты корреляционному анализу. Высокая положительная корреляция дала бы основание полагать, что новая шкала валидна.

С другой стороны, группе студентов, заявляющих о том, что у них есть фобия по отношению к паукам, можно было бы предъя-

вить этот тест перед и после показа им тарантула. Если их оценки увеличатся, это может означать, что тест действительно измеряет тревогу. Основная цель таких приемов конвергентной валидизации состоит в том, чтобы определить, будут ли оценки теста варьиро­вать в соответствии с теоретическими ожиданиями. К сожалению, неудачные попытки установить ожидаемые связи могут быть обус­ловлены некоторыми проблемами либо с самим тестом, либо с другими средствами измерения. Например, другой тест тревоги может быть не валиден или некоторые из индивидуумов, заявляю­щие, что они боятся пауков, на самом деле могут и не испытывать такого чувства. Однако если оценки теста действительно варьиру­ют в соответствии с теорией, вывод о том, что тест валиден, пред­ставляется разумным.

Второй подход — исследование «дивергентной валидности» — устанавливает, что тест не измеряет никакой черты, с которой он теоретически не должен быть связан. Например, в литературе ут­верждается, что тревога не связана с интеллектом, социально-эко­номическим статусом, социальной желательностью и т.д. Поэтому если тест, направленный на измерение тревоги, на самом деле обнаружил высокую корреляцию с любой из этих переменных, должны возникнуть сомнения в том, действительно ли он измеря­ет тревогу в целом.

Прогностическая вал идность

Психологические тесты очень часто используются для прогно­за поведения, и их успех в этом известен как прогностическая валидность. Например, тест может быть дан подросткам с целью предсказать, кто из них будет страдать шизофренией в дальней­шей жизни, или психологический тест может быть использован для отбора наиболее перспективного кандидата на должность про­давца — тест будет обладать прогностической валидностью, если с его помощью можно показать, что люди с более высокими тесто­выми оценками будут иметь больший объем продаж. Этот процесс производит впечатление очень простой, прямолинейной процеду­ры, но на практике таковой не является.

Первая проблема заключается в природе критериев, по кото­рым проводится оценка теста. Хотя постановка диагноза шизофре­нии или определение объема продаж достигается достаточно пря­мыми способами, для характеристики многих видов деятельности одного критерия недостаточно. Работа университетского препода-

вателя иллюстрирует это положение. Моя работа включает препо­давание, администрирование и исследование, наблюдение за ас­пирантами, обеспечение неформальной помощи по вопросам ста­тистики и программирования, поддержку и ободрение студентов и т.д. — перечень достаточно длинный. При этом совсем не ясно, как можно оценить большинство этих видов деятельности или оп­ределить их относительную важность. В других случаях (например, когда управляющие ранжируют работников) разные эксперты могут пользоваться абсолютно разными эталонами.

Вторая прблема известна как «ограничение диапазона». Систе­ма отбора обычно состоит из нескольких стадий: например, пер­вичное психометрическое тестирование уменьшает число соиска­телей, доводя его до контролируемых пропорций, за ним следует собеседование и более детальная психологическая оценка индиви­дуумов, которые прошли через первую стадию. В конечном счете все соискатели, получающие назначение, будут иметь похожие (высокие) оценки по тестам отсеивания (иначе они были бы от­вергнуты перед стадией собеседования), и, таким образом, диапа­зон оценок в группе отобранных индивидуумов окажется намного меньше, чем в общей популяции. Последнее создаст проблемы для любой попытки валидизировать скрининговый тест, поскольку этот ограниченный диапазон способностей будет уменьшать корреля­цию между тестом и любым критерием. Имеются способы реше­ния данной проблемы (см.: Dobson, 1988; он предлагает одно из лучших решений), но эти два примера показывают, насколько трудно установить прогностическую валидность теста.

Задание для самопроверки 133

(а) Должен ли надежный тест быть валидным?

(б) Должен ли валидный тест быть надежным?

(в) Что такое «конструктная валидность», «содержательная валидность» и «прогностическая валидность» теста?

(г) Что такое «конвергентная валидность» и «дивергентная валидность»?

Резюме

Надежность теста важна, потому что она показывает, насколько близко тестовая оценка приближается к подлинной оценке личнос­ти по измеряемой черте. Следовательно, она показывает, разум-

но ли использовать оценку, полученную по определенному тесту, как средство измерения скрытой черты. К сожалению, довольно легко завысить коэффициент надежности альфа, включая в тест задания, которые, по сути, просто перефразируют друг друга. Это очевидная проблема, которая недостаточно явно представле­на в литературе. Чтобы избежать этого, создателям теста необхо­димо проверять все пары заданий, гарантируя таким способом их локальную независимость.

Принципиально важно установить перед использованием теста для каких-либо целей его содержательную валидность, конструктную валидность и(или) прогностическую валидность. Тест с низкой на­дежностью не может быть валидным измерением черты. Однако высокая надежность не гарантирует высокую валидность.

Предложения

по дополнительному чтению

Все учебники по психометрике и многие книги по статистике дают описания теории надежности. Среди них лучшими являются — книги Кронбаха (Cronbach, 1994 и другие издания), Анастази (Anastasi, 1961 и другие издания), а также Гилфорда и.Фрачтера (Guilford, Fruchter, 1978). Специалисты по психометрике обычно рекомендуют книгу Нанелли (Nunnally, 1978); многие формулы, упомянутые выше, взяты из этой ра­боты, например, формулы, показывающие, как надежность связана с подлинной оценкой черты (уравнение 6.1) и насколько близка оценка надежности (вычисленная на одной выборке испытуемых) к ее подлин­ному значению (Nunnally, 1978, р. 208; обратите внимание на опечатку в уравнении 6.13, р. 207).

Ответы на задания по самопроверке

13.1 (а) При допущении, что каждая пара заданий находится под вли­янием различных наборов посторонних факторов, корреляция будет показывать степень, с которой пара заданий оценивает измеряемую черту, в данном случае — экстраверсию.

(б) Поскольку вопрос 1 обнаруживает низкую корреляцию со всеми другими вопросами, он, по-видимому, является плохим средством измерения экстраверсии.

(в) Очевидно, следовало бы написать больше вопросов теста, дать старые и новые вопросы новой выборке испытуемых (по крайней мере 200 человек) и заново вычислить корреляции и коэффициент альфа. Существует также другая возможность. Мы

видели в ответе на вопрос (б), что вопрос 1 на самом деле не ачень удачен, он обнаруживает низкие корреляции со всеми другими вопросами теста. Удаление этого вопроса из теста уве­личит среднюю корреляцию между оставшимися вопросами (от 0,206, базирующейся на 10 корреляциях, до 0,285, базирующейся на 6 корреляциях) и сократит длину теста. Первый фактор будет вести к увеличению коэффициента альфа, второй— к уменьше­нию. Таким образом, возможно (хотя и не обязательно), что уда­ление вопроса 1 может также увеличить коэффициент альфа. Мы вернемся к этому в главе 18.

13.2. (а) Альтернативные названия внутренней согласованности, или надежности, теста, которую я называю «альфа» на протяжении всей книги.

(б) Подобные действия обеспечивают очень высокую надежность, поскольку задания разделяют общую специфическую вариатив­ность, так же как и измерение одной и той же черты.

(в) Стандартная ошибка измерения (SEM) показывает, насколь­ко точными окажутся оценки индивидуумов. Если по результам некоторого теста показатель IQ ребенка оказался равен 100, а SEM — 3, мы могли бы с большим основанием считать, что в этом случае интеллект ребенка в действительности был равен 100, чем в том случае, когда тест имел бы ошибку измерения, равную 5.

(г) -^/0,81 = 0,9 и ^/0,56 = 0,75. Представим себе, что тест 2 был

абсолютно надежен. В этом случае корреляция между тестом 1 и тестом 2 должна быть такой же, как корреляция между тес­том 1 и подлинной оценкой, т.е. 0,9. Однако, поскольку тест 2 не является совершенно надежным, корреляция будет ниже. Мож­но показать, что самая большая корреляция, которую только можно ожидать между двумя тестами, представляет собой про­изведение квадратных корней из показателей их надежности. В этом случае не следовало бы ожидать, что тесты будут корре-

I

лировать более чем

0,68. Это со-

впадает с тем, что я говорил ранее, указывая на то, что всю вариативность шкалы репрессии—сенситизации можно объяс­нить социальной желательностью, хотя корреляция между двумя шкалами была только -0,91, а не -1,0.

13.3. (а) Совершенно определенно нет. Высокая надежность говорит вам, что тест измеряет некоторую черту или состояние, не объяс­няя, что представляет собой эта черта или состояние. (б) Да. Хотя имейте в виду, если надежность небольшой шкалы

оказывается слишком высокой (например, шкала из 10 вопро­сов с надежностью 0,9), это дает основания полагать, что один и тот же вопрос перефразировали несколько раз.

(в) Смотри текст.

(г) При конструктной валидизации конвергентная валидность — показатель того, в какой степени тест коррелирует с характери­стиками, с которыми он должен коррелировать, если он вали­ден; например, в какой степени тест IQ коррелирует с оценками академической успеваемости детей, которые дают учителя. Дивергентная валидность подтверждает, что тест обнаруживает незначимые корреляции с характеристиками, с которыми он те­оретически не должен быть связан. Например, оценки, получен­ные по тесту IQ, можно было бы коррелировать с тестами, из­меряющими социальную желательность, различные аспекты лич­ности и т.д.; при этом предполагается, что такие корреляции будут близки к нулю.

 


ФАКТОРНЫЙ АНАЛИЗ

Факторный анализ — это статистический инструмент, кото­рый лежит в самой основе исследования индивидуальных разли­чий. Многочисленные варианты его использования включают кон­струирование тестов, выявление основных параметров личности и способностей, установление того, сколько отдельных психологи­ческих характеристик (т.е. черт) измеряется набором тестов или заданиями теста. В этой главе вводится широкое понятие фактор­ного анализа. Детали того, как выполнять и интерпретировать фак­торный анализ, описываются в главе 15.

Главы, рекомендуемые для предварительного чтения

1, 11 и 13.

Введение

Мы должны начать с упоминания о том, что термин «фактор­ный анализ» может относиться к двум довольно разным статисти­ческим методикам. Исследовательский факторный анализ* — более старая (и более простая) методика, ее описание составляет основу этой главы и первый раздел главы 15. Конфирматорный факторный анализ и его разновидности (известные как «анализ путей», «ана­лиз латентных переменных» или «модели LJSREL») полезны во

* В отечественной литературе он иногда называется эксплораторным фактор-ным анализом. (Прим. науч. ред.)

= 1-989

многих областях за пределами изучения индивидуальных различий и особенно популярны в социальной психологии. Краткое описа­ние этой методики дается в конце главы 15. Авторы не всегда четко указывают, какой из видов факторного анализа использовался — исследовательский или конфирматорный. Если вы увидите термин «факторный анализ» в журнале, следует допустить, что имеется в виду исследовательский факторный анализ.

В главе 13 было показано, почему важно, чтобы все задания шкалы измеряли одну (и только одну) психологическую пе­ременную, и кроме того, был введен коэффициент альфа как показатель надежности шкалы. Эта техника исходит из того, что все задания в тесте формируют одну шкалу и коэффициент на­дежности, в сущности, проверяет, насколько это допущение обоснованно.

Альтернативный подход может включать исследование выбор­ки заданий теста и выявление того, сколько различных шкал они содержат и какие задания принадлежат каждой шкале (шкалам). Предположим, что психолог предъявлял группе испытуемых ряд словарных заданий, несколько заданий — на понимание и несколь­ко заданий, содержащих анаграммы. Наиболее полезным было бы узнать, будут ли словарные задания формировать первую шкалу, задания на понимание — вторую и задания на решение анаграмм — третью шкалу или (например) словарные задания и задания на понимание сформируют одну шкалу, в то время как задачи на решение анаграмм — другую. Однако давайте сначала рассмотрим более простой пример. Предположим, что в интересах науки вы планируете собрать следующие данные у случайно сформирован­ной выборки, например, у 200 знакомых студентов в баре вашего университета или колледжа:

« VI — вес тела (в кг);

• V2 — степень невнятности речи (ранжируется по шкале от 1 До 5);

• V3 — длина ноги (в см);

• V4 — разговорчивость (ранжируется по шкале от 1 до 5);

• V5 — длина руки (в см);

• V6 — степень шатания при попытках пройти по прямой ли­нии (ранжируется по шкале от 1 до 5).

Кажется вероятным, что VI, V3 и V5 будут варьировать со­вместно, поскольку крупные люди будут склонны иметь длинные

руки и ноги и больше весить. Все эти три пункта измеряют неко­торое фундаментальное свойство индивидуумов вашей выборки: их размеры. Точно так же вероятно, что V2, V4 и V6 будут варьи­ровать совместно, так как количество употребленного алкоголя, вероятно, будет связано с четкостью речи, разговорчивостью и с осложнениями при попытках пройти по прямой линии. Таким образом, хотя мы собрали шесть фрагментарных данных, эти пе­ременные измеряют только 2 конструкта: размеры тела и степень опьянения. В факторном анализе вместо слова «конструкт» обыч­но используется слово «фактор», и далее мы будем следовать этой традиции.

Исследовательский факторный анализ, по существу, выпол­няет две функции.

• Он показывает, сколько отдельных психологических конст­руктов (факторов) измеряется данным набором переменных. В приведенном выше примере такими двумя факторами яв­ляются размеры тела и степень опьянения.

• Он показывает, какие именно конструкты измеряют исполь­зованные переменные. В приведенном выше примере было показано, что VI, V3 и V5 измеряют один фактор и V2, V4 и V6 измеряют другой, совершенно отличный фактор.

В некоторых формах факторного анализа дополнительно мож­но прокоррелировать факторы между собой, и затем вычислить для каждого испытуемого индивидуальную оценку по каждому фактору в целом («факторные оценки»).

Оценки по полным тестам (а не по его отдельным заданиям) также могут подвергаться факторному анализу — на самом деле именно так эта методика и используется. Факторный анализ в этом случае может показать, действительно ли тесты, которые, пред­положительно, измеряют один и тот же конструкт (например, шесть тестов, которые претендуют на измерение тревожности), проду­цируют один фактор, или же в этом случае будут выделены не­сколько факторов (указывая на то, что тесты на самом деле изме­ряют несколько разных характеристик). Факторный анализ оце­нок, полученных на основе полных тестов, может быть чрезвычайно полезен для установления того, что именно измеряется группой тестов, поскольку многозначность языка допускает, что одному и тому же конструкту разными исследователями могут быть даны различные наименования. «Тревога» у одного автора может обо-

значать то же самое, что «нейротицизм» — у другого или «негатив­ный аффект» — у третьего. Число терминов, используемых в пси­хологии индивидуальных различий, потенциально безгранично, и без факторного анализа нет надежного способа установить, дей­ствительно ли несколько шкал измеряют один и тот же базисный психологический феномен. Например, если в издательском ката­логе указано, что имеются психологические средства измерения «нейротицизма», «тревоги», «истерии», «силы Эго», «нервознос­ти», «низкой самоактуализации» и «боязливости», кажется разум­ным задать вопрос: действительно ли это шесть отдельных поня­тий или это одна и та же характеристика, которой исследователи, имеющие разные теоретические воззрения, дали различные на­звания? Факторный анализ может точно ответить на этот вопрос, и поэтому он чрезвычайно полезен для упрощения структуры лич­ности и способностей.

Возможности факторного анализа не ограничиваются анали­зом заданий или оценок теста. Можно факторизовать, например, показатели времени реакции, взятые из когнитивных тестов раз­личного типа, чтобы определить, какие из них (если такие есть) связаны между собой. Возможен и иной подход. Предположим, что группу школьников, которые не имели специальной спортив­ной подготовки или спортивной практики, оценивали с точки зрения их успешности в соревнованиях по 30 видам спорта с по­мощью комплекса оценок, включавшего рейтинги тренеров, ре­гистрацию времени, среднюю длину броска, процент отсутствия очков при игре в крикет, забитые голы и любые другие измере­ния показателей успешности, наиболее подходящие для каждого вида спорта. Единственное условие состоит в том, что каждый ребенок должен участвовать в каждом виде соревнования. Фактор­ный анализ обнаружит много интересных фактов; например, он покажет, будут ли индивидуумы, успешные в одной игре с мя­чом, демонстрировать тенденцию к успешности во всех осталь­ных играх, будут ли соревнования по бегу на длинные и короткие дистанции образовывать две различные группы (и какой вид со­ревнования будет входить в какую группу) и т.д. Таким образом, вместо того чтобы обсуждать происходящее в терминах успешно­сти в 30 различных областях, будет возможно суммировать ЭТУ информацию, обсуждая ее в категориях шести основных спортив­ных способностей (или стольких способностей, сколько выявит факторный анализ).

Изучение исследовательског

факторного анализ

 

Верхняя часть табл. 14.1 представляет собой опросник, состоя­щий из шести утверждений. Шестерых студентов попросили отве­тить на каждое утверждение, используя пятибалльную оценочную шкалу, как показано в таблице, и их ответы даны в нижней части таблицы. Они говорят о степени согласия каждого участника с каж­дым утверждением.

Упражнение

Посмотрите на ответы студентов, расположенные в нижней час­ти табл. 14.1. Попытайтесь определить, основываясь на этих циф­рах, существует ли какая-либо степень совпадения между каж­дым из шести заданий и, если существует, то укажите между какими из них. На это упражнение отводится около 5 минут.

Первое, что вы можете сделать, — это оценить усредненные ответы по каждому заданию. На основе этого вы можете увидеть, что индивидуумы не склонны соглашаться с утверждением 4, от­веты на которое имеют средний ранг 2,16, в то же время большин­ство индивидуумов обнаруживают тенденцию соглашаться с ут­верждением 2, среднее значение ответов на которое составляет 3,5. Вы можете таже попробовать проанализировать вариативность оценок, чтобы узнать, образуют ли одни утверждения больший диапазон ответов, чем другие. Однако, как бы ни были интересны эти данные, они в действительности не помогают нам понять ха­рактер связей между переменными. Было бы полезно знать, дей­ствительно ли шесть утверждений оценивают шесть различных понятий или же они полностью перекрываются, а таблица сред­них значений этого показать не может.

В главе 11 говорилось, что опросники обычно обрабатываются путем суммирования оценок, полученных индивидуумом по всем входящим в состав опросника утверждениям. Было бы интересно повторить то же самое с данными из табл. 14.1 и вычислить, на­пример, что Стефен по всему опроснику имеет оценку 18 и т.д. Если вы попытаетесь сделать это, вам следует прежде прочесть главу 11 еще раз. Помните, что имеет смысл суммировать оценки индивидуумов только в том случае, если все задания оценивают

Таблица 14.1

Личностный опросник, состоящий из шести заданий, и ответы пяти студентов

Q1 Я получаю удовольствие от общения 1

Q2 Я часто действую импульсивно

Q3 Я веселый человек 4 5

Q4 Я часто ощущаю депрессию

Q5 Мне трудно засыпать по ночам 4 5

Q6 Большие толпы людей вызывают 12345

у меня чувство тревоги

Пожалуйста, обведите кружком одну цифру, которая соответствует вашей реакции на утверждение:

обводите «5», если вы полностью согласны с описывающим вас ут­верждением;

обводите «4», если оно характеризует вас достаточно хорошо; обводите «3», если не имеете определенной точки зрения или не уве­рены в том, что это утверждение характеризует вас;

обводите «2», если чувствуете, что утверждение не вполне характери­зует вас;

обводите «1», если абсолютно уверены, что это утверждение вас не

характеризует.

  Q1 Q2 Q3 Q4 Q5 Q6  
Стефен I  
Энн  
Пол  
Джанетт  
Майкл  
Кристин  

один и то же психологический концепт, а у нас нет никакого представления о том, действительно ли шесть утверждений опрос­ника измеряют одно, два, три, четыре, пять или шесть достаточно разных психологических феноменов. Основная цель данного ана­лиза — как раз ответить на этот вопрос, и потому описанная стра­тегия также оказывается неподходящей.

Наблюдательные читатели могли заметить некоторые тенден­ции в этих данных. Вы могли обратить внимание, что ответы ин­дивидуумов на утверждения I, 2 и 3 обнаруживают тенденцию к сходству. Стефен склонен соглашаться со всеми тремя, Энн не

склонна соглашаться с ними, в то время как остальные обнару­живают более или менее нейтральную позицию по отношению к ним. Это, коечно, довольно грубые апроксимации, однако вы можете видеть, что ни один из тех, кто поставил себе ранг 1 или 2 по одному из этих трех вопросов, не присваивает себе ранг 4 или 5 по одному из других. Благодаря этому можно предположить, что удовольствие от общения, импульсивность действий и жизне­радостное отношение демонстрируют тенденцию к группирова­нию и поэтому можно ожидать, что эти три задания образуют шкалу. Тоже самое относится и к заданиям с 4 по 6. Опять такие испытуемые, как Стефен и Энн, которые дают себе низкую оценку по одному из этих трех утверждений, присваивают себе низкий балл и по оставшимся двум утверждениям, в то время как Крис­тин выставляет себе высокие оценки по всем трем позициям.

Таким образом, оказывается, что в этом опроснике существует два кластера утверждений: первый состоит из утверждений 1, 2 и 3, второй — из утверждений 4, 5 и 6. Однако обнаружение этих связей — очень сложная задача. Если порядок колонок в табл. 14.1 изменить, то эти связи трудно или невозможно будет обнаружить «на глаз».

К счастью, статистическая характеристика, именуемая коэф­фициентом корреляции, дает возможность определить, действительно ли индивидуумы, имеющие низкие баллы по одной переменной, склонны иметь низкий (или высокий) балл по другим перемен­ным. Краткое описание корреляционных методов дано в приложе­нии А, к котерому следует обратиться в данный момент, если в этом есть необходимость.

В табл. 14.2 представлены корреляции, вычисленные на основе табл. 14.1. (Подробное вычисление этих корреляций не приводит­ся, поскольку работы по статистике, такие, как книга Хауэлла (Howell, 1992), объясняют эту процедуру во всех деталях.) Эти корреляции подтверждают наши предположения, касающиеся вза­имосвязей между ответами студентов на утверждения с 1 по 3 и с 4 по 6. Ответы на утверждения с 1 по 3 высоко коррелируют между собой (0,933; 0,824 и 0,696, соответственно) и почти не коррели­руют с ответами на вопросы с 4 по 6 (-0,096 и т.д.)- Точно так же ответы на утверждения с 4 по 6 высоко коррелируют между собой (0,896; 0,965 и 0,808, соответственно) и почти не коррелируют с ответами на утверждения с 1 по 3.

Таким образом, корреляции позволяют сделать вывод, что утверждения с 1 по 3 формируют одну естественную группу, а

Таблица 14,2 Корреляции между шестью утверждениями табл. 14.1








Дата добавления: 2015-03-03; просмотров: 530;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.031 сек.