Линейные комбинации признаков
1.11 Во многих методах многомерной статистики используется понятие линей-ной комбинации признаков. Пусть мы рассматриваем набор признаков X1, X2, X3, …, Xm и пусть вектор индивидуальных наблюдений для i-го случая равен
Xj' = X 1j X 2j X 3j …X mj .
Пусть также имеется вектор некоторых коэффициентов c
c'= c 1 c 2 c 3 … c m .
Тогда для любого индивида можно вычислить скалярное произведение
yj= c'Xj =c 1X 1j + c 2X 2j + c 3X 3j + … + c mX mj , (1.15)
которое называется линейной комбинацией вектора X. Она может быть найдена для любого индивида, если для него известен вектор наблюдений Xi. По существу yj может трактоваться как некий новый признак, к которому мы переходим от набора исходных показателей, измеряемых непосредственно. Однако, при соответствующем выборе или, что встречается чаще - специальном вычислении, коэффициентов ci, линейная комбинация yj может иметь наперед заданные оптимальные свойства, которыми исходные признаки не обладают.
Определим основные свойства нового признака, находимого как линейная комбинация исходных показателей. Если для последних в некоторой совокупнос-
- 14 -
Рисунок 1.3. Иллюстрация понятия линейной комбинации исходных признаков
Y = c1X1 + c2X2
сти индивидов характерно многомерное нормальное распределение с вектором средних M и ковариационной матрицей S, то линейная комбинация y = c'X будет
иметь одномерное нормальное распределение со средней
My= c'M =c 1M 1j + c 2M 2j + c 3M 3j + … + c mM mj (1.16)
и с дисперсией
sy2 = c' S c (1.17)
1.12. Проиллюстрируем понятие линейной комбинации набора признаков геометрически. Совокупность m признаков образует m-мерное пространство, в котором в виде точек с координатами, соответствующими значениям этих признаков, изображаются индивидуальные наблюдения. Эти точки образуют облако, которое может быть заключено в некоторый корреляционный эллипсоид. Двумерный случай изображен на рисунке 1.3. Если нам задан набор коэффициентов c, соответствующий линейной комбинации y = c' X, то его элементы c 1 c 2 c 3 … c m зададут в пространстве признаков координатную ось y, по которой можно будет измерять
значения этого нового признака у всех индивидов. Эти элементы определят, в частности, углы наклона новой оси по отношению к осям X1 и X2. Если спроецировать все точки корреляционного эллипса на ось признака X1, можно получить одномерное распределение этого показателя. Точно также проекции всех точек, соответствующих наблюдениям, на оси X2 дадут распределение этого признака. Аналогично, проекции всех наблюдений на новую ось y определят распределение
- 15 -
Рисунок 1.4. Иллюстрация перехода от набора исходных признаков X1 и X2 к системе двух новых переменных, находимых как линейные комбинации исходных признаков y1 = c11X1 + c21X2 и y2 = c12X1 + c22X2
значений этого нового показателя со средней арифметической My = c'M, и дисперсией sy2 = c' S c и нормальной формой кривой распределения.
1.13 Пусть теперь для набора m признаков X 1, X 2 ,X 3 , … ,Xm нам необходимо получить как линейную комбинацию не один новый признак y = c'X, а целое их семейство, включающее n новых показателей y 1, y 2 ,y 3 , … ,yn . Пусть первый из их y1 = c1'Xнаходится при помощи набора коэффициентов c1' = [c11 c 21 c31 c m1], второй - y2 = c2'X - при помощи c2' = [c12 c 22 c32 c m2], и т.д., последний - yn =cn'X по вектору cn' = [c1n c 2n c3n c mn]. Тогда из n векторов-строк ci' можно получить единую матрицу
c'1 c11 c21 c31 … cm1
c'2 c12 c 22 c32 … cm2
C= c'3 = c13 c23 c 33 … cm3 ,
… … … … … …
c’N c1n c2n c3n … cmn
а переход от m исходных признаков к n новым переменным - записать в компакт-ном виде y' = C'X , где y' - набор новых признаков
y' = [y1 y2 y3 … yn] .
- 16 -
Новые признаки y1, y2, y3, …, ynмогут иметь такие желательные свойства, которых обычно лишены исходные показатели X1, X2, X 3, …, Xm , но которые не- обходимы тем или иным причинам.
Для набора новых переменных y вектор средних My может быть найден как
My = С'M , (1.18)
а ковариационная матрица Sy- в виде
Sy = C'SC , (1.19)
где M и S - вектор средних и ковариационная матрица набора исходных признаков X1, X2, … , Xm . Формулы (1.18) и (1.19) являются обобщением (1.16) и (1.17).
В частности, ковариация для любой пары новых переменных yi = ci'Xи yj = cj'X (при i ¹ j) может быть получена по формуле
covij = ci'Scj, (1.20)
а коэффициент корреляции - из
covij ci'Scj
rij = = . (1.21)
sy1 sy2 (ci'Sc i cj'Scj)1/2
Очень часто новые признаки получаются как нескоррелированные показатели, так что для всех сочетаний i и j covij = ci'Scj= 0. В этом случае
sy12 0 0 … 0
0 sy22 0 … 0
Sy = 0 0 sy32 … 0 .
… … … … …
0 0 0 … sym2
1.14. Геометрически переход от набора m исходных признаков X к системе n новых переменных y, находимых как линейные комбинации y = C'X, означает переход к новой системе координат (рис.1.4), в которой для y1, y2, y3, ..., yn будет наблюдаться нормальное распределение, если для набора X также была характерна нормальность. Количество новых линейных комбинаций (n) может быть мень-шим числа исходных признаков (m). Тогда для набора y можно получить не только желаемые оптимальные свойства, но также добиться уменьшения (иногда - весьма значительного) количества анализируемых переменных. Это может сделать получаемые результаты более компактными и имеющими большие возможности содержательной интерпретации.
Дата добавления: 2016-02-13; просмотров: 1651;