Актуальность технического обслуживания 14 страница
В-третьих, факторный анализ применяется при проверке психометрических свойств опросников, особенно когда они используются в новых культурах или популяциях. Например, предположим, что, в соответствии с руководством по использованию австралийского личностного теста, его следует обрабатывать путем сложения баллов, полученных по всем нечетным заданиям, которые формируют одну шкалу, в то время как сумма баллов, полученных по всем четным заданиям, образует другую шкалу. Когда этот тест предъявляется выборке людей в Великобритании и вычисляются корреляции между заданиями и затем факторизуются, то должно быть обнаружено два фактора, причем один фактор
должен иметь существенные нагрузки по всем нечетным заданиям, а другой фактор — существенные нагрузки по всем четным заданиям. Если такая структура не обнаружена, это значит что опросник в новой ситуации не работает и его не следует использовать традиционным способом.
В связи с этим нетрудно понять, почему факторный анализ так важен в психологии индивидуальных различий и психометрике. Один и тот же статистический аппарат может быть использован для конструирования тестов, разрешения теоретических споров по поводу количества и природы факторов, измеряемых тестами и опросниками, для проверки того, работают ли тесты так, как должны, и законно ли использовать тот или иной тест в другой популяции или в другой культуре. Возможно, вам даже захочется узнать, существует ли какая-нибудь связь между надежностью теста и величиной собственного значения фактора, полученного при факторизации теста, когда выделяется только один фактор.
В этой главе шла речь об основных принципах факторного анализа. Однако многие вопросы так и остались без ответа, и среди них следующие:
•Каким образом решать, сколько факторов должно быть выделено?
•Как может компьютерная программа в действительности выполнить факторный анализ?
• Какие типы данных целесообразно обрабатывать с помощью факторного анализа?
• Каким образом результаты, полученные в факторно-аналитических исследованиях, следует интерпретировать и представлять?
Эти и другие вопросы будут проанализированы в главе 15.
Предложения
о дополнительному чтению
Очень старая работа Айзенка по логическим основам факторного анализа (Eysenck, 1953) вполне заслуживает прочтения; Чайлд (Child, 1990) и Клайн (Юте, 1994) предлагают два базисных, но доступных для понимания студентов варианта введения в факторный анализ.
Ответы на задания по самопроверке
14.1. (а) Самый маленький угол между парой переменных на рис. 14.2 — это угол между V1 и V2. Следовательно, они имеют наиболее высокий уровень корреляции.
(б) Угол между переменными V3 и V2 равен приблизительно 270° (если двигаться по часовой стрелке). Табл. 14.3 показывает, что это соответствует корреляции, равной 0.
(в) Угол между переменными V5 и V3 равен приблизительно 210', что соответствует корреляции -0,87.
14.2. (а) Облическое решение — это таблица факторных нагрузок, при которых факторы не находятся под прямыми углами друг к другу; они коррелируют между собой.
(б) Факторная нагрузка — это корреляция между переменной и фактором.
(в) Матрица факторной структуры — это таблица, показывающая корреляции между всеми переменными и всеми факторами.
(г) Ортогональное решение — это таблица факторных нагрузок, в которой все факторы не коррелируют между собой (т.е. находятся под прямыми углами друг к другу).
(д) Матрица взаимных корреляций факторов — это таблица, которая представляет корреляции между всеми факторами в факторном анализе. Для ортогонального факторного анализа все корреляции между факторами будут равны нулю (так как они независимы). Для облического решения корреляции будут иметь значение больше нуля.
14.3. Собственное значение фактора представляет собой сумму возведенных в квадрат нагрузок этого фактора, вычисленную для всех переменных. Общность переменной — это сумма возведенных в квадрат нагрузок по этой переменной, вычисленная по всем факторам.
(а) Общность переменной V2 есть 0,982 + О2 = 0,9604. Общности V3, V4, V5 и V6, подобно этому, составляют 0,82; 0,7325; 0,9604 и 0,7325, соответственно.
(б) Собственное значение фактора 2 равно 0,102 + 0,0г + (-0,102) + + 0,85г + 0,982 + 0,85г, или 2,4254.
(в) Поскольку имеется шесть переменных, фактор 2 объясняет
или 0,4042, вариативности между ними.
(г) Проанализированный в тексте пример показывает, что фактор 1 объясняет 0,423 вариативности. Поскольку факторы орто-
гональны, факторы 1 и 2 совместно описывают 0,43 + 0,4042 -0,834 вариативности между переменными.
(в) Изменение всех нагрузок между переменными и данным фактором приведет к тому, что фактор будет иметь корреляцию, равную -1,0, по отношению к его предшествующей позиции. Табл.14.3 показывает, что это соответствует его расположению в противоположном направлении (180*) по отношению к предшествующей позиции. Большие отрицательные корреляции между переменной и фактором подразумевают, что фактор указывает в сторону, противоположную направлению переменных, которые имеют самую большую корреляцию с ним. Изменение знака всех корреляций изменяет направление фактора таким образом, что он проходит через кластер переменных.
ВЫПОЛНЕНИЕ
И ИНТЕРПРЕТАЦИЯ
ФАКТОРНОГО АНАЛИЗА
Общая картина
Хотя в главе 14 дается обзор основных принципов факторного анализа, в ней преднамеренно были пропущены некоторые детали, необходимые как для выполнения факторного анализа, так и для оценки методики адекватности публикуемых исследований. Многие журнальные статьи, которые используют факторный анализ, методически настолько слабы, что утрачивают свое значение, поэтому очень важно, чтобы каждый был способен распознавать такие исследования при обзоре литературы (делать поправку на их несовершенность).
Главы, рекомендуемые
для предварительного чтения
14.
Введение
Несмотря на то что исследовательский факторный анализ можно выполнить вручную (и более старые работы, например, книга Кэттелла (Cattell, 1952), содержат детальную инструкцию для проведения подобных экспериментов), этим могут заниматься лишь энтузиасты или мазохисты, у которых имеется несколько свободных недель. Вычисления, которые следует произвести, требуют много времени и изобилуют повторениями, поэтому лучше всего использовать компьютер. Большинство современных статистических пакетов программного обеспечения обладают достаточными возможностями для проведения исследовательского факторного
анализа в течение нескольких минут, а не часов. Время, необходимое для того, чтобы провести анализ, составляет величину, приблизительно пропорциональную числу переменных, возведенному в третью степень. Конфирматорный факторный анализ (который будет описан в конце этой главы) требует специального программного обеспечения, и для выполнения этого анализа иногда нужны часы.
Исследовательский факторный анализ
Независимо от того, выполняется этот вид анализа с использованием счётов или же с помощью ЭВМ, он состоит из восьми основных стадий (каждая из них обсуждается ниже).
Стадия 1. Убедитесь, что ваши данные подходят для факторного анализа.
Стадия 2. Выберите модель — факторный или компонентный анализ.
Стадия 3. Решите, какое количество факторов необходимо выделить, чтобы представить ваши данные.
Стадия 4. В случае использования факторного (а не компонентного) анализа оцените общность каждой переменной.
Стадия 5. Выделите факторы с учетом установленных общно-" стей (извлечение факторов).
Стадия 6. Вращайте эти факторы так, чтобы они прошли через кластеры переменных, контролируя процесс получения «простой структуры».
Стадия 7. В случае необходимости подсчитайте факторные оценки.
Стадия 8. В случае необходимости проведите иерархический анализ, если он уместен.
Одна из проблем факторного анализа — это его мощность. Используемые компьютерные программы почти всегда обеспечат тот или иной ответ, и, пытаясь анализировать данные с помощью самых разнообразных методов, выбирая разное количество факторов и концентрируясь на разных наборах переменных, можно «вытянуть» что-либо полуправдоподобное из самого скверного исследования. Время от времени сталкиваешься с журнальными ста-
тьями, в которых эта методика явно используется в отчаянных попытках спасти хоть что-нибудь из плохо организованного эксперимента. Действительно, имеются некоторые области психологии, такие, как. психология личных конструктов, в которых подобная практика является нормой. Таким образом, крайне важно, чтобы те, кто использует методику или читает научную литературу, имели представление об общей организации и выполнении факторно-аналитических исследований. В факторном анализе,как нигде, уместно изречение компьютерных специалистов: «мусор вносим, мусор выносим», поэтому данная глава начинается с обзора типов данных, которые могут быть с пользой обработаны факторным анализом.
Пригодность данных для факторного анализа
Не все данные могут быть подвергнуты факторному анализу. Он может быть применен, если соблюдаются следующие критерии.
1. Все переменные в анализе являются непрерывными, т.е. измеряются по меньшей мере по трехбалльной интервальной шкале (такой, как «да/?/нет», кодируемой как 2/1/0). Обычно нельзя подвергать факторному анализу категориальные данные, которые образуют шкалу наименований, перечисляющую, например, цвет волос (черный/каштановый/рыжий), страну проживания, предпочтение при голосовании, профессию. Иногда можно выбрать коды для категориальных данных, которые позволят преобразовать их в некоторый род интервальной шкалы, и она уже законно может быть подвергнута факторному анализу. Например, поддержка коммунистической партии может кодироваться «1», социал-демократической партии — «2», консервативной/республиканской партии — «3» и партии правого крыла — «4». Эти числа формируют шкалу доминирования «взглядов правого крыла», которая может быть подвергнута факторному анализу на законных основаниях.
2. Все переменные имеют (приблизительно) нормальное распределение, а асимметричные величины выделены и обработаны должным образом (см. например, книгу Табачника и Файдел-ла (Tabatchnick, Fidell, 1989, ch. 4). Асимметричные данные, если необходимо, могут быть преобразованы (см., например,
книги Табачника и Файделла (Tabatchnick, Fidell, 1989) или Хауэдла (Howell, 1992)).
3. Связи между всеми парами переменных приблизительно линейны или по крайней мере не имеют очевидной U-образ-ной или J-образной формы.
4. Переменные независимы. Самый простой способ проверить это — просмотреть все статистические выражения и обеспечить, чтобы каждая измеряемая переменная отражала действие не более чем одной оценки из числа подвергающихся факторному анализу. Если у каждого индивидуума получены оценки по четырем заданиям теста, допустимо создавать и факторизовать новые переменные, такие как
или {(оценка 1 + оценка 2 — оценка 3) и 1 — оценка 4},
но не {(оценка I + оценка 2 + оценка 3) и (оценка 1 +
+ оценка 4)}
или {(оценка 1) и (оценка 1 + оценка 2 + оценка 3 + оценка 4)},
поскольку в последних двух случаях одна из наблюдаемых тестовых оценок («оценка 1») действует на две переменные, подвергающиеся факторизации. Вот общие случаи, когда этот принцип нарушается:
(а) факторизуется набор переменных, часть из которых -произведение от других переменных, также участвующих в анализе. Например, факторный анализ оценок по шести заданиям теста совместно с обобщенной оценкой индивидуумов по этим шести заданиям;
(б) вопросы, заданные в такой форме: «Вопрос 1: сколько будет 2 х 3?»
«Вопрос 2: чему равен ответ на первый вопрос, возведенный в квадратную степень?»
Таким образом, если ответ на первый вопрос дан неправильно, ответ на второй вопрос также должен быть неправильным.
Иногда выделить такие взаимозависимости бывает более трудным делом. Например, экспериментатор может
зарегистрировать отдельные показатели биотоков из разных отделов мозга наряду с мышечной активностью из двух точек и намеревается подвергнуть факторному анализу, средний показатель этих реакций вместе с некоторыми заданиями опросника. Как знают читатели, имеющие дело с психофизиологией, маловероятно, что все эти величины будут независимыми. Мышечные движения (такие, как мигание глаз и биение сердца) могут обнаруживаться во всех записях физиологических процессов, если не предпринять специальных мер предосторожности. Это может привести к тому, что различные электрические сигналы будут взаимозависимы и, следовательно, они не подходят для факторного анализа; (в) невозможно подвергать факторному анализу все оценки любого теста, в котором испытуемый не в состоянии получить предельно высокую (или предельно низкую) оценку по всем его шкалам (так называемые «ипсатив-ные тесты»), поскольку все шкалы в этих тестах обязательно связаны отрицательными корреляциями. Сторонники этих тестов утверждают, что можно просто удалить одну из шкал перед факторизацией. Однако тогда интерпретация результатов будет зависеть от того, какую шкалу мы (произвольно) изъяли.
5. Корреляционная матрица обнаруживает лишь несколько корреляций выше 0,3. Если все корреляции небольшие, следует серьезно задуматься над тем, можно ли будет извлечь из матрицы какие-либо факторы. Если корреляции невелики из-за использования тестов с низкой надежностью, может быть, подойдет процедура корректировки эффектов ненадежности, как показано, в частности, Гилфордом и Фрачтером (Guilford, Fruchter, 1978). Подобно этому, если плохая организация эксперимента привела к тому, что данные были собраны в группе с ограниченной представительностью (например, оценки способностей были получены в выборке студентов университета, а не в выборке, взятой из общей популяции), для коррекции корреляций может оказаться подходящим применение перед проведением факторного анализа формулы Добсона (Dobson, 1988). Однако этими фрагментами психометрического колдовства следует пользоваться с осторожностью, и на самом деле они не за-
меняют тщательно и глубоко продуманный план эксперимента.
Тест сферичности Бартлетта (Bartlett, 1954) проверяет гипотезу, что все корреляции, расположенные вне диагонали, равны нулю, и это обычно вычисляют с помощью пакетов программ, таких, как SPSS. Однако этот тест очень чувствителен к размерам выборки, а маленькие корреляции между переменными в большой выборке приведут к тому, что тест укажет на уместность применения факторного анализа. Намного безопаснее просто визуально проанализировать корреляционную матрицу.
6. Пропущенные данные распределены по матрице данных случайным образом. Было бы не очень разумно подвергать факторному анализу данные, где доля пропущенных значений в выборке охватывает полные блоки заданий. Например, одни испытуемые могут пройти тесты А, В и С. Другие могут пройти только тесты А и С, а остальные могут пройти только тесты В и С. По этой причине такие данные нельзя подвергать факторному анализу, хотя некоторые статистические пакеты сделают это без особого труда.
7. Любые пропущенные величины либо оценены (Tabatchnick, Fidell, 1989), либо в компьютерной программе заложена команда игнорировать их. При введении данных в компьютер очень легко кодировать пропущенные значения числом «99» (или каким-либо другим), а затем забыть ввести в программу указание о том, что величина «99» представляет пропущенные данные. Такая ошибка, очевидно, лишит законной силы весь анализ.
8. Большая выборка испытуемых. Эксперты дают различные рекомендации, однако не следует пытаться применять факторный анализ, если число испытуемых меньше 100, поскольку стандартные ошибки корреляции в этом случае окажутся неприемлемо велики. Это означает, что корреляционная матрица небольшой выборки испытуемых практически не будет похожа на «подлинную» корреляционную матрицу. Другими словами, анализ, базирующийся на маленьких выборках, вряд ли будет воспроизводимым, но он также не будет в достаточной степени соответствовать реально существующим взаимосвязям между переменными. Обычно считается, что необходимо связать размер выборки с числом переменных, под-
23 -
вергающихся анализу. Например, Нанелли (Nunnally, 1978) придерживается точки зрения, что испытуемых должно быть по крайней мере в 10 раз больше, чем переменных. Более поздние исследования, такие, как работы Барретта и Клай-на (Barrett, Kline, 1981) и Гваданоли и Велисера (Guadagnoli, Velicer, 1988), показывают, что в случае, если испытуемых больше, чем переменных, само отношение числа испытуемых к числу переменных не так важно, как абсолютный размер выборки и величина факторных нагрузок. Следовательно, если факторы хорошо определены (например, с нагрузками 0,7, а не 0,4), экспериментатору нужна меньшая выборка, чтобы выделить их. Если известно, что анализируемые данные отличаются высокой надежностью (например, тестовые оценки, а не ответы на отдельные задания), то эти ограничения можно в некоторой степени ослабить. Однако попытки проводить факторный анализ на небольших наборах данных (таких, как репертуарные решетки) обречены на провал, поскольку большая стандартная ошибка корреляций гарантирует, что факторное решение будет и произвольным, и невоспроизводимым.
Проблема возникает при дихотомических данных, т.е. в тех случаях, когда оценки могут принимать только одно из двух значений. Такие данные часто встречаются при анализе ответов на задания теста (1 = «да», 0 = «нет» или 1 - «правильный ответ», 0 = «неправильный ответ»). Когда дихотомические задания коррелируют между собой, корреляции могут достичь 1 только в случае, если оба задания теста имеют приблизительно одинаковые уровни сложности. Таким образом, небольшая корреляция может означать, что
• не существует связи между заданиями сходного уровня сложности,
или
• два задания имеют сильно различающиеся уровни сложности. Таким образом, факторный анализ обычных пирсоновских корреляций между дихотомическими заданиями обнаруживает тенденцию порождать факторы «трудности задания», поскольку только задания, близкие по уровню сложности, могут, вероятно, коррелировать между собой и формировать фактор. Иные задания, которые измеряют тот же самый конструкт, но имеют другие уровни сложности, будут по этой причине обнаруживать низкие на-
грузки по результирующему фактору. Однако чрезвычайно сложно обойти эту проблему, используя стандартный статистический пакет, который не предлагает альтернативы использованию пирсоновских корреляций. Существуют и другие типы коэффициентов корреляций, которые позволяют избежать этих проблем, и Чамберс (Chambers, 1982) дает полезное, хотя и излишне насыщенное техническими деталями, краткое описание литературы. Законность факторизации таких коэффициентов все еще обсуждается (Vegelius, 1976), хотя большинство исследователей обычно проделывают эту процедуру. Короче говоря, жизнь станет намного легче, если можно будет избежать использования дихотомических данных.
Задание для самопроверки 15.1
Психолог изучает математические навыки в выборке, состоящей из 100 одиннадцатилетних детей; это является частью ее дипломной работы. Она собрала данные по 120 заданиям теста, каждое из которых она оценивала как правильный или неправильный ответ. Она также учитывала место жительства (графство) каждого участника и намеревалась использовать факторный анализ этих ответов, чтобы заново выявить основную структуру математических способностей и установить, не выше ли математические способности детей в одних графствах по сравнению с другими. Какой совет вы могли бы ей дать?
Факторный анализ
или компонентный анализ
*
Одна научная школа поддерживает точку зрения, что факторный (но не компонентный) анализ никогда не должен использоваться из-за трудности установления общностей и чрезвычайной сложности определения факторных оценок. Другая школа придерживается взгляда, что, поскольку факторная модель априори с гораздо большей вероятностью соответствует данным, должна приветствоваться любая попытка оценить общности. С этих позиций модель главных компонент просто не соответствует заданиям теста и другим данным, которые, как следует ожидать, содержат уникальную вариативность. Некоторые авторы, например, Кэрролл (Carroll, 1993), полагают, что бессмысленно использовать модель главных компонент, так как известно, что она не соответствует типу данных, которые обычно анализируются, хотя многие из нас утверждают, что на практике не имеет особого значения, какая
методика применяется, поскольку разные методы анализа редко дают сильно различающиеся результаты. Заинтересованные читатели должны посмотреть работу Велисера и Джексона (Velicer, Jackson, 1990) для более детального обсуждения этой темы.
Тесты для определения количества факторов
Разработано несколько способов, помогающих исследователям выбрать «правильное» количество факторов. Они требуют осторожного обращения: при принятии этого важного решения нельзя полагаться на компьютерные программы, поскольку известно, что большинство из них (в частности SPSS) используют методы, которые оказываются несостоятельными и не могут включить некоторые из наиболее полезных тестов. Определение количества выделяемых факторов, вероятно, — наиболее важное решение, которое необходимо принять, когда проводишь факторный анализ. Ложное решение может привести к бессмысленным результатам при обработке самого четкого набора данных. Можно попытаться выполнить несколько вариантов анализа, базирующегося на разном количестве факторов, и использовать несколько различных тестов, определяющих выбор факторов.
Первые руководящие указания дают теория и прошлый опыт. Иногда может возникнуть желание использовать факторный анализ, чтобы убедиться, что тест работает в соответствии с ожиданиями, будучи использован в другой культуре, группе больных или каким-либо другим способом. В этих целях может проводиться конфирматорный факторный анализ (см. ниже), но если исследовательский факторный анализ является более предпочтительным, предыдущие результаты могут быть использованы в качестве ориентиров в определении того, сколько факторов надо выделять. Если проведенный в США факторный анализ теста (методически адекватный) выявил семь факторов, то любая попытка подвергнуть тест факторному анализу в другой культуре должна рассмотреть как минимум семифакторное решение.
Безусловно, и теория, и прошлый опыт имеют позитивное значение, но в большинстве случаев факторный анализ действительно является, по сути, исследовательской методикой. Исследователь часто не будет иметь весомых теоретических оснований для решения вопроса о том, сколько факторов следует выделить, а предшествующие исследования иногда методически настолько
несовершенны, что оказываются бесполезными. Существует ряд других приемов, которые могут быть использованы в этих обстоятельствах, все они направлены на определение количества факторов, которые следует извлекать из корреляционной матрицы. Проблема состоит в том, что некоторые из них, будучи включены в компьютерные пакеты, попадают иногда в руки неопытных пользователей, поэтому оказываются просто бесполезными. Кроме того, различные методики не всегда дают совпадающие результаты: один тест может указывать на шесть факторов, другой — на восемь, а предыдущее исследование — на девять! При таких обстоятельствах самое безопасное — рассматривать несколько решений и проверять их на психологическую пригодность. Пользователи должны установить также:
• не способствует ли увеличение количества факторов упрощению решения (например, уменьшению доли нагрузок в диапазоне от ~0,4 до 0,4). Если увеличение количества факторов не влияет на простоту решения (или очень незначительно его упрощает), то его применение скорее всего не имеет смысла;
• не появляются ли какие-либо большие корреляции между факторами при осуществлении облических вращений. Последнее может указывать на то, что было извлечено слишком много факторов и два из них пытаются пройти через один и тот же кластер переменных. Об этом могут косвенно свидетельствовать корреляции между факторами, которые будут больше приблизительно 0,5;
• не разделились ли какие-либо хорошо известные факторы на две или более частей. Например, если во множестве предшествующих исследований было показано, что набор заданий формирует только один фактор (например, экстраверсию), а в вашем анализе они все же формируют два фактора, это говорит о том, что было, вероятно, извлечено слишком много факторов.
Один из старейших и наиболее простых тестов для определения количества факторов — это тест, описанный Кайзером (Kaiser, 1960) и Гуттманом (Guttman, 1954) и известный как «критерий Кайзера—Гуттмана». Его преимуществом является простота исполнения. Надо просто провести анализ данных методом главных компонент, выделив столько факторов, сколько существует перемен-
ных, но без проведения операции, известной как «вращение» (она будет обсуждаться ниже). Собственные значения факторов вычисляются, как обычно, сложением квадратов нагрузок по каждому компоненту. После этого надо просто посчитать, сколько факторов имеют собственные значения выше 1,0 — это и есть количество факторов, которое можно использовать.
Существует немало проблем с использованием этой методики; наиболее очевидная из них связана с ее чувствительностью к количеству переменных, взятых для анализа. Поскольку каждое собственное значение — это просто сумма квадратов факторных нагрузок, при увеличении количества переменных должно увеличиваться и собственное значение. Тест на определение количества факторов должен давать один и тот же результат, независимо от того, четыре или 40 переменных представлены в каждом факторе, а критерий Кайзера—Гуттмана явно не действует таким образом. Более того, Хакстиан и Мюллер (Hakstian, Mueller, 1973) отмечали, что данная процедура на предназначена для определения количества факторов. Поскольку его исключительно легко проводить автоматически, большинство статистических пакетов будут выполнять тест Кайзера—Гуттмана как задаваемый по умолчанию. Тем не менее этот тест следует всегда отвергать.
Тест «каменистой осыпи» («scree test»), предложенный Кэт-теллом (Cattell, 1966), концептуально тоже прост. Так же как и критерий Кайзера—Гуттмана, он базируется на собственном значении факторов, полученных в результате применения метода главных компонент, не прошедших вращение. Однако он учитывает относительные величины собственных значений факторов, и поэтому не должен быть чувствителен к вариациям в количестве анализируемых переменных. Этот тест основывается на зрительном изучении графика, представляющего последовательные собственные значения факторов, так как это показано на рис. 15.1. График должен быть построен с максимально возможной аккуратностью с использованием специальной бумаги или графопостроительной программы. Точность графиков, производимых некоторыми статистическими пакетами, недостаточна для этой цели.
Основная идея проста. Очевидно, что точки в правой стороне рис. 15.1 образуют прямую линию, называемую «склон». Можно проложить через эти точки линейку и определить, сколько собственных значений факторов явно располагаются над этой линией —- это и есть количество факторов, которые должны быть извлечены.
Рис. 15.1. Тест «каменистой осыпи», демонстрирующий собственные значения факторов, полученных в результате анализа главных компонент девяти переменных до вращения матрицы. График показывает, что следует извлечь два фактора.
Рис. 15.1 представляет двухфакторное решение. Дальнейшие примеры использования тестов такого типа были даны Кэттеллом (Cattell, 1966) в главе 5 книги Кэттелла (Cattell, 1978) и Кэттеллом и Фогельманом (Cattell, Vogelman, 1977). Несколько широко распространенных пособий по факторному анализу описывают этот тест неправильно, утверждая, что количество факторов соответствует количеству собственных значений факторов, располагающихся над прямой линией, плюс еще один. Таким образом, в приведенном выше решении они стали бы настаивать на выделении трех факторов. Не очень понятно, как возникло это недоразумение, поскольку в статьях Кэттелла и в его книге, вышедшей в 1978 г., совершенно ясно говорится по этому поводу: «Последний реальный фактор — это тот фактор, который обнаруживается перед тем, как график превращается в горизонтальную прямую линию» (Cattell, Vogelman, 1977).
Проблема теста «каменистой осыпи» заключается в том, что он полностью основывается на субъективных суждениях и может иногда иметь несколько возможных интерпретаций, особенно когда размер выборки или «выступающие» факторные нагрузки невелики (Gorsuch, 1983). Иногда на графике обнаруживается более чем
один четко идентифицируемый излом прямой линии. В таких случаях необходимо просто просмотреть собственные значения факторов, которые расположены над крайним слева отрезком прямой линии. Хорошая методика для определения количества извлекаемых факторов — МАР-тест (Velicer, 1976). В вычислительном отношении она слишком сложна, чтобы выполнять ее вручную, но она не включена в основные коммерческие пакеты для выполнения факторного анализа, несмотря на то что является одной из наиболее признанных точных методик (Zwick, Velicer, 1986). Существует несколько других подходящих методов, но они тоже остаются не введенными в главные пакеты. Компьютерные моделирующие исследования показали, что в отсутствие МАР-теста тест «каменистой осыпи», вероятно, представляет наиболее точный руководящий принцип для принятия всех важных решений по поводу количества факторов, извлекаемых из корреляционной матрицы.
Дата добавления: 2015-03-03; просмотров: 978;