Определение общностей
Факторный анализ
Основные понятия факторного анализа
6.1 Метод главных компонент был основан на переходе от признаков X1, X2, X3, ..., Xm или от их нормированных значений z1, z2, z3, ..., zm - к новым некоррелированным переменным - главным компонентам y1 = b1'z, y2 = b2'z, y3 = b3'z, ..., ym = bm'z, что в более компактном виде можно было записать в виде
y = B'z, (6.1)
где матрица B включала в виде своих столбцов собственные векторы b1, b2, b3,..., bm. Формулу (6.1) можно также переписать в ином виде
z = By , (6.2)
что в развернутой форме можно представить также как
z1 = b11y1 + b21y2 + b31y3 + ... + bm1ym
z2 = b12 y1 + b22 y2 + b32 y3 + ... + bm2 ym
z3 = b13 y1 + b23 y2 + b33 y3 + ... + bm3 ym (6.3)
... ... ... ... ... ...
zm = b1m y1 + b2m y2 + b3m y3 + ... + bmm ym .
Для отдельного i-го исходного признака такое равенство можно записать в виде
zi = b1iy1 + b2iy2 + b3iy3 + ... + bmiym . (6.4)
В формулах (6.3) и (6.4) bji - означает элемент j-го собственного вектора, соответствующего j-й главной компоненте yj, для i-го признака zi.
Выражения (6.2) - (6.4) означают разложение нормированной величины каждого исходного признака zi в виде суммы вкладов, каждый из которых обусловлен j-й главной компонентой yj. Кроме этого, в соответствии с разделом 5.12 дисперсия любого i-го нормированного признака, равная 1, может быть представлена в виде
1 = l1b1i2 + l2b2i2 + l3b3i2 + ... + lmbmi2 , (6.5)
также означающем ее разложение в виде суммы вкладов, зависящих от всех главных компонент. Наконец, любой коэффициент корреляции rik для i-го и k-го признаков может быть записан в виде суммы
rik = l1b1ib1k + l2b2ib2k + ... + lmbmibmk , (6.6)
вкладов в него каждой из всех m главных компонент. В формулах (6.5) - (6.6) lj - означает j-е собственное число.
Аналогичные разложения могут быть выписаны и через нагрузки aji признаков на главные компоненты. Так, с учетом соотношения aji = bji(lj)1/2, формулы (6.5) - (6.6) можно переписать как
1 = a1i2 + a2i2 + a3i2 + ... + ami2 , (6.7)
и
rik = a1ia1k + a2ia2k + ... + amiamk . (6.8)
Значения главных компонент yj имеют дисперсии равные соответствующим собственным числам li. Если пользоваться их нормированными величинами zyj = yj / (lj)1/2, то разложение (6.4) также можно представить через нагрузки
zi = a1izy1 + a2izy2 + a3izy3 + ... + amizym . (6.9)
- 106 -
6.2 Приведенные разложения значений исходных признаков, их дисперсий и коэффициентов корреляции жестко связаны с системой главных компонент, имеющих фиксированные и вполне определенные свойства. Вместе с тем, подобные разложения могут быть записаны через другие новые переменные, имеющие не столь определенно заданные свойства. Назовем эти новые переменные факторами. Тогда формулы (6.4) и (6.9) можно записать в виде разложения значений признака через вклады этих факторов
zi = a1if1 + a2if2 + a3if3 + ... + anifn . (6.10)
Здесь fj - факторы, значения которых имеют нормированную форму варьирования с нулевой средней и единичной дисперсией. Если число главных компонент было равным числу исходных признаков m, то количество факторов n может быть другим. Разумнее положить, что n < m, так как это будет означать достижение большей компактности описания факторами закономерностей варьирования и коррелированности признаков. Если главные компоненты были взаимно некоррелированными, то для факторов это свойство может и не соблюдаться. Факторы могут по желанию исследователя или в соответствии с реальной ситуацией быть некоррелированными или обладающими взаимными связями. Понятно, что главные компоненты могут также считаться факторами.
6.3 Если мы имеем два признака X1 и X2, связанные взаимной корреляцией с коэффициентом r12, это означает, что их вариация в какой-то степени определяется одновременным и параллельным действием некоторых общих причин (рис.6.1). Очевидно, что эти влияния приводят к появлению в изменчивости каждого из них некоторого особого компонента. Такие компоненты вариации этих двух признаков будут согласованы, так что с изменением значений одного признака величина другого - также будет определенным образом закономерно изменяться. Компонент изменчивости признака, обусловленный влиянием на него общих причин, называется общностью этого признака.
Корреляция признаков никогда не достигает предельного случая с коэффициентом r12 = 1. Это означает, что вариация любого признака кроме действия общих причин вызывается также влиянием некоторых специфических факторов изменчивости, независимых для каждого отдельного показателя. Это приводит к появлению в вариации любого признака кроме общности также особого дополнительного компонента, называемого характерностью.
Характерности разных признаков независимы друг от друга. Реальная величина корреляции двух признаков складывается из соотношения их общностей и характерностей. При высоком уровне общности и малом - характерности у некоторого признака, значения его коэффициентов корреляции с другими показателями будут высокими. Напротив, если в вариации признака особенно велика характерность, уровень его коррелированности - мал.
Если мы имеем дело с нормированными значениями признаков, когда дисперсии равны 1, то для j-го показателя можно записать
1 = hj2 + dj2 (6.11)
где hj2 - его общность, dj2 - характерность. Это означает, что дисперсия признака может быть представлена как сумма общности и характерности.
В свою очередь, в характерности можно выделить долю изменчивости признака, связанную с влиянием ошибок измерений ej2, и долю вариации, обусловленную действием
- 107 -
Признаки
X1 X2
Ü r 12 Þ
ñ õ ö ñ
D1 F12 D2
Характерные Общие причины Характерные
причины вариации причины
вариации X1 X1 и X2 вариации X2
Рисунок 6.1. Схема возникновения корреляции между признаками X1 и X2 вследствие влияния на их изменчивость общих и характерных причин вариации
собственно специфических причин вариации - bj2. Последний компонент называется специфичностью признака. С учетом сказанного можно записать равенство
1 = hj2 + bj2 + ej2 . (6.12)
6.4 Вышеприведенные рассуждения являются умозрительными, но вполне вероятными. С их учетом разложение значений признака по факторам (6.10) существенно изменится. Так, если принять справедливость выделения в изменчивости любого признака двух компонент - общности и характерности, потребуется также различать и факторы, одно из назначений которых – описывать вариацию исходных переменных. Поэтому, среди факторов следует выделять особую категорию так называемых общих факторов, учитывающих общности признаков. Для описания характерностей признаков следует полагать наличие для каждого из них так называемого характерного фактора. Тогда разложение (6.10) для j-го признака zj примет более сложный вид
zj = a1jf1 + a2jf2 + ... + anjfn + djuj , (6.13)
где a1j, a2j, ... anj - коэффициенты этого признака для общих факторов: f1 , f2 , ... , fn, dj - аналогичный коэффициент на характерный фактор uj. Для всех m исходных нормированных признаков такие разложения можно записать в виде
z1 = a11f1 + a21f2 + ... + an1fn + d1u1
z2 = a12f1 + a22f2 + ... + an2fn + d2u2
z3 = a13f1 + a23f2 + ... + an3fn + d3u3 . (6.14)
... ... ... ... ... ...
zm = a1mf1 + a2mf2 + ... + anmfn + dmum
Коэффициенты всех m признаков на n общих факторов можно записать в виде так называемой матрицы факторного отображения
- 108 -
a11 a21 a31 ... an1
a12 a22 a32 ... an3
a13 a23 a33 ... an3 = A , (6.15)
... ... ... ... ...
a1m a2m a3m ... amm
где i-м столбцом окажутся элементы этого отображения на все признаки у i-го фактора. Аналогичным образом, в виде диагональной матрицы можно записать элементы факторного отображения на характерные факторы у всех m исходных признаков
d1 0 0 ... 0
0 d2 0 ... 0
0 0 d3 ... 0 = D .
... ... ... ... ...
0 0 0 ... dm
Значения общностей и характерностей признаков также могут быть записаны в виде диагональных матриц Hи V
h12 0 0 ... 0
0 h22 0 ... 0
0 0 h32 ... 0 = H, (6.16)
... ... ... ... ...
0 0 0 ... hn2
d12 0 0 ... 0
0 d22 0 ... 0
0 0 d32 ... 0 = V , (6.17)
... ... ... ... ...
0 0 0 ... dn2
Очевидно, что эти матрицы соотносятся в виде
H + V = I (6.18)
С учетом введенных обозначений разложение значений m признаков по факторам можно представить в компактном виде
z = Af+ Du , (6.19)
где z - вектор нормированных значений m исходных признаков, f- вектор значений n общих факторов, u - вектор характерных факторов. Это разложение называется факторным отображением.
Обычно исследователей интересуют закономерности коррелированности признаков, которые проявляются в общих факторах. Поэтому часто характерные факторы не рассматриваются, и факторное отображение сводится к краткой его форме
z = Af. (6.20)
Кроме набора элементов факторного отображения признаков на факторы обычно рассматриваются коэффициенты корреляции между факторами и признаками, называемые также нагрузками. Вся совокупность этих коэффициентов называется факторной структурой. Она может быть записана в виде соответствующей прямоугольной матрицы
- 109 -
r11 r21 r31 ... rn1
r12 r22 r32 ... rn3
r13 r23 r33 ... rn3 = Rf , (6.21)
... ... ... ... ...
r1m r2m r3m ... rmm
где rij - коэффициент корреляции i-го фактора и j-го признака. В компонентном анализе элементы факторного отображения являлись одновременно нагрузками исходных признаков на главные компоненты. В факторном анализе это соответствие выполняется не всегда. Однако, матрицы факторного отображения (6.15) и факторной структуры (6.18) соотносятся достаточно простым образом и поэтому, зная одну из них, можно получить - другую.
Матрицы A и Rf описывают основные закономерности коррелированности признаков. Поэтому, в определении и истолковании этих матриц заключается основная задача факторного анализа.
6.5 В факторном анализе подразумевается, что каждый j-й индивид характеризуется набором значений общих факторов f1j, f2j, ..., fnj и характерных факторов u1j, u2j, ..., unj. Все они имеют нормированную форму варьирования с нулевой средней и единичной диспер-сией. Кроме этого общие факторы могут быть нескоррелированными или обнаруживаю-щими взаимные связи. В первом случае общие факторы называются ортогональными или прямоугольными, во втором - облическими или косоугольными. В зависимости от наличия или отсутствия корреляций между факторами их свойства могут различаться.
Ортогональные факторы обладают удобным свойством, в соответствии с которым матрицы факторного отображения A и факторной структуры Rf равны между собой
A= Rf. (6.22)
Поэтому, каждой элемент факторного отображения некоторого признака на некоторый ортогональный фактор является одновременно коэффициентом корреляции между ними или нагрузкой. Понятно, что элементы факторного отображения на ортогональные факторы всегда по величине меньше единицы. Для главных компонент их элементы факторного отображения также одновременно были нагрузками, что следовало из нескоррелированности (ортогональности) этих новых переменных.
Общности признаков просто связаны с элементами факторного отображения или нагрузками на ортогональные факторы
hj2 = a1j2 + a2j2 + a3j2 + ... + anj2 . (6.23)
Иными словами, общность j-го признака равна сумме квадратов нагрузок этого признака на все общие факторы. Это равенство также может трактоваться как разложение общности признака как суммы вкладов в нее всех общих факторов.
Так же, как это было свойственно для главных компонент, для ортогональных факторов может быть введена Pi - доля суммарной вариации признаков, описываемая каждым из них. Для i-го фактора ее можно найти по формуле
Pi = (ai12 + ai22 + ai32 + ... + aim2) . (6.24)
m
В этом случае суммируются квадраты нагрузок у всех m признаков на i-й фактор.
- 110 -
Наконец, нагрузки ортогональных факторов связаны с коэффициентами корреляции между исходными признаками следующим соотношением
rik = a1ia1k + a2ia2k + a3ia3k + ... + aniank . (6.25)
Здесь rik - коэффициент корреляции между i-м и k-м исходными признаками, aji и ajk - нагрузки j-го фактора на этих признаках. Это равенство может быть выписано для всех коэффициентов корреляции, которые можно вычислить для набора m исходных признаков, что позволяет найти по множеству значений rik все нагрузки на общие факторы. Соотношение (6.25) может также трактоваться как разложение любого коэффициента корреляции на ряд вкладов, каждый из которых ajiajk - описывает влияние j-го фактора на связь i-го и k-го исходных признаков.
В ситуации, когда используются облические факторы, равенство матриц факторного отображения и факторной структуры не выполняется A ¹ Rf . Так как облические факторы скоррелированы, при проведении анализа находится матрица коэффициентов корреляции между факторами
1 ф12 ф13 ... ф1n
ф12 1 ф23 ... ф2n
Ф = ф13 ф23 1 ... ф3n , (6.26)
... ... ... ... ...
ф1n ф2n ф3n ... 1
где фij - коэффициент корреляции между i-м и j-м факторами.
Таким образом, при использовании облических факторов находятся три матрицы: отображения - A, структуры - Rf , факторных корреляций - Ф. Между ними существуют простые соотношения
Rf = AФ (6.27)
A = Rf Ф-1 .
Для облических факторов формулы (6.23) - (6.25) перестают выполняться.
6.6 Проведение факторного анализа обычно осуществляется при выполнении ряда этапов. Исходным материалом для рассмотрения, как правило, является корреляционная матрица, хотя имеются методы, когда результаты факторного анализа не зависят от того, какая матрица рассматривалась - корреляционная или ковариационная.
При проведении анализа главных компонент рассматривалась вся суммарная изменчивость исходных признаков. Поэтому, на главных диагоналях корреляционной матрицы, подвергавшейся вычислительной процедуре, находились единицы, соответствующие значениям целых дисперсий нормированных величин признаков. В факторном анализе рассматриваются общности признаков. Поэтому, основным материалом для проведения факторного анализа является так называемая редуцированная корреляционная матрица, содержащая на главной диагонали не единицы, а – общности признаков
h12 r12 r13 ... r1m
r12 h22 r23 ... r2m
R* = r13 r23 h32 ... r3m . (6.28)
... ... ... ... ...
r1m r2m r3m ... hm2
- 111 -
Равенство (6.25), выполняющееся для ортогональных факторов, в обобщенном виде может быть записано как
R* = AA' . (6.29)
Действительно, произведения разных строк нагрузок матрицы Aдля разных признаков с номерами i и k дают в соответствии с формулой (6.25) величину коэффициента корреляции i-го и k-го признаков rik. Аналогично, произведение i-ой строки нагрузок матрицы A на себя дает в соответствии с равенством (6.23) значение общности i-го признака.
Для облических факторов равенство (6.29) не выполняется и справедлива иная формула
R* = Rf A' . (6.30)
6.7Таким образом, первым шагом проведения факторного анализа является нахождение общностей, и определение тем самым редуцированной корреляционной матрицы, что позволяет в дальнейшем получить матрицу факторных нагрузок A. Процедура нахождения A или так называемая факторизация, обычно предполагает, что факторы ортогональны. Часто результаты вычислений матрицы A не позволяют достаточно ясно проинтерпретировать закономерности коррелированности признаков, которые описывают столбцы нагрузок. Поэтому, в дальнейшем проводится преобразование факторов с целью добиться более простого и ясного описания направлений коррелированности признаков. При этом от исходных ортогональных факторов, полученных в результате вычисления матрицы A, переходят к новым ортогональным или облическим факторам, интерпретация которых часто бывает более ясной.
Таким образом, при проведении факторного анализа осуществляется три шага:
- нахождение оценок общностей;
- получение матрицы нагрузок на ортогональные факторы;
- преобразование этих факторов.
Часто на втором шаге этой схемы происходит одновременно окончательное уточнение значений общностей признаков. Тогда считается, что на первом этапе были получены приближенные их оценки.
Определение общностей
6.8 Нахождение общностей и определение тем самым редуцированной корреляционной матрицы R* требуется осуществить до начала выделения факторов - определения матрицы нагрузок на них A. Однако, в свою очередь, точные значения общностей по формуле (6.23) могут быть найдены только после получения нагрузок. Этот порочный круг может быть преодолен двумя способами.
В соответствии с первым из них общности находятся всего лишь как приближенные оценки. Дело в том, что при рассмотрении корреляционных матриц не слишком малого размера, определенных по значительным наборам признаков (m > 20), некоторые погрешности значений приближенных оценок общностей по сравнению с большим количеством m(m - 1)/2 точно вычисленных коэффициентов корреляции исходных признаков не скажутся сколько-нибудь серьезно на точности получаемых нагрузок. Для получения приближенных оценок было предложено несколько эвристических методов.
- 112 -
Первый и простейший из них заключается в нахождении оценки общности hi2 для некоторого i-го признака как максимального значения его коэффициента корреляции для связей со всеми остальными рассматриваемыми показателями
hi2 = max (ri1, ri2, ri3, ..., rim) . (6.31)
Опыт широкого использования этого приема в практике факторного анализа 30 - 50-х годов показал не слишком плохое качество таких простейших оценок общностей для не слишком малых размеров корреляционных матриц.
Другую простую оценку общности признака можно получить как среднюю величину из его коэффициентов корреляции с остальными показателями
1 m-1
hi2 = S rij . (6.32)
m - 1 j = 1
Эта оценка общности дает несколько заниженные значения.
Более логически обоснованные оценки общностей можно получить по методу множественной корреляции. Здесь в качестве оценок общности hi2 для некоторого i-го признака используется квадрат его множественной корреляции Ri2 со всеми остальными рассмат-риваемыми показателями. Действительно, Ri2 по своему смыслу равен доле вариации i-го признака, обусловленной влиянием на него всех остальных m - 1 рассматриваемых переменных. Несмотря на то, что полного логического совпадения с понятием общности признака здесь - нет, определенная близость все же прослеживается. Так как требуется одновременно получить m значений коэффициентов множественной корреляции, это удобнее сделать с использованием формулы (3.29). Здесь сначала находится матрица R-1 обратная к корреляционной матрице R для всех рассматриваемых признаков. Тогда ква-драт коэффициента множественной корреляции любого признака Xi по остальным показателям X может быть найден по формуле
Ri2 = 1 - , (6.33)
r(ii)
где r(ii) - i-й диагональный элемент матрицы R-1. Как показывает сравнение этих оценок общностей с более точными, значения Ri2 дают несколько заниженные величины для hi2.
6.9 Наиболее точные оценки общностей получаются при одновременном нахождении общностей и нагрузок в ходе итерационных процедур. Одна из таких процедур может быть организована следующим образом. Сначала по методу квадрата множественной корреляции из формулы (6.33) получаются приближенные оценки общностей, которые подставляются на главную диагонально корреляционной матрицы, в результате чего находится первое приближение редуцированной ее формы R*1. Для матрицы R*1 находится матрица факторного отображения A1, содержащая нагрузки. По нагрузкам из формулы (6.23) получаются новые оценки общностей, позволяющие получить новую редуцированную матрицу R*2. В связи с тем, что диагональные элементы матрицы R*1 находились в приближенном виде, нагрузки из матрицы A1 будут также приближенными. Однако, определенные по ним значения общностей окажутся более близкими к истинным величинам. Поэтому, второе приближение редуцированной корреляционной матрицы R*2 окажется более точным. По нему в свою очередь можно найти второе приближение матри-
- 113 -
цы нагрузок A2, по которому можно найти третье приближение редуцированной матрицы R*3 и т.д. Ход процесса можно изобразить в виде схемы:
R - ð приближенные значения общностей
ò
R*1 ð ð A1
É ï ï Ã
R*2 ð ð A2
É ï ï Ã
... ... ... ... ...
É ï ï Ã
R*k ð ð Ak
На некотором k-м шаге-итерации значения матриц Ak и Ak-1 совпадут с заданной точностью. Это будет означать, что достигнуто также совпадение двух последовательных приближений R*k и R*k-1, в том числе и стоящих на главной диагонали значений общностей.
Дата добавления: 2016-02-13; просмотров: 1387;