Вторая дисперсия может также быть найдена усреднением в виде
1 k
sW2 = S (Ni - 1) si2 . (2.10)
N - k i = 1
- 23 -
В ситуации, когда sB2 неслучайно превышает sW2 , можно констатировать существование достоверной межвыборочной изменчивости средних значений признака в k генеральных совокупностях, из которых взяты k выборок. Сравнение двух дисперсий производится с применением обычного F-критерия Фишера.
2.6 В многомерном случае для проверки существования неслучайной межвыборочной вариации средних уровней набора признаков X1, X2, X3, ..., Xm используется сходный способ рассмотрения данных, называемый многомерным дисперсионным анализом. Пусть мы рассматриваем k выборок с числами наблюдений в них N1, N2, N3, ..., Nk . Для каждой из этих выборок по набору m признаков были найдены векторы средних M1, M2, M3,..., Mk и ковариационные матрицы S1, S2, S3,..., Sk . По всем N = N1 + N2 + N3 + ... + Nk наблюдениям, можно найти общий вектор средних
1 k
Mo = S NiMi . (2.11)
N i=1
Точно также как в одномерном случае, когда общая вариация по отдельному признаку описывалась суммой Qo, находимой по формуле (2.7), многомерная изменчивость, проявляющаяся во всем материале, может быть измерена аналогичной матрицей
S (X1ij - M1o)2 ... S (X1ij - M1o) (Xmij - Mmo)
i, j i, j
T= ... ... ... . (2.12)
S (X1ij - M1o) (Xmij - Mmo) ... S (Xmij - Mmo)2
i, j i, j
Здесь диагональные элементы описывают общую изменчивость по каждому из m признаков, внедиагональные элементы – измеряют общую соотносительную вариацию по всем парам признаков. Первый подписной индекс соответствует номеру признака (1, 2, ..., m), второй (i) - номеру выборки (1, 2, ..., k), третий (j) - номеру наблюдения (1, 2, ..., N). Суммирование ведется по всем N наблюдениям, имеющимся в k выборках. Нетрудно видеть, что каждый диагональный элемент матрицы T точно соответствует сумме (2.7).
Межгрупповая изменчивость набора признаков X1, X2, X3, ..., Xm может быть измерена многомерным аналогом суммы QB - матрицей
S Ni (M1i - M1o)2 ... S Ni (M1i - M1o)(Mmi - Mmo)
i i
B = ... ... ... . (2.13)
S Ni (M1i - M1o)(Mmi - Mmo) ... S Ni (Mmi - Mmo)2
i i Здесь каждый диагональный элемент описывает многомерную межгрупповую вариацию по отдельному признаку и точно соответствует одномерной сумме QB
- 24 -
для него. Внедиагональные элементы матрицы B описывают соотносительную вариацию средних величин по всем парам признаков. Суммирование ведется по всем k выборкам.
Внутригрупповая вариация набора признаков X1, X2, X3, ..., Xm может быть описана многомерным аналогом суммы QW - матрицей
S (X1ij - M1i)2 ... S (X1ij - M1i)(Xmij - Mmi)
i, j i, j
W = ... ... ... . (2.14)
S (X1ij - M1i)(Xmij - Mmi) ... S (Xmij - Mmi)2
i, j i, j
Каждый диагональный элемент матрицы W точно соответствует одномерной сумме QW и измеряет суммарную внутривыборочную вариацию для отдельного признака. Внедиагональные элементы этой матрицы описывают соотносительную внутривыборочную изменчивость для всех попарных сочетаний признаков. Суммирование везде проводится для всех наблюдений и по всем выборкам.
Для трех матриц T, B и W выполняется равенство
T = B + W . (2.15)
На основе каждой из них может быть найдена соответствующая ковариационная матрица. В частности, межгрупповая ковариационная матрица
s B11 s B12 s B13 ... .sB1m
BsB12 sB22 sB23 ... sB2m
SB = = sB13 sB23 sB33 ... sB3m (2.16)
k - 1 ... ... ... ... ...
s B1m sB2m sB3m ... sBmm
на главной диагонали включает межгрупповые дисперсии отдельных признаков (f = 1, 2, 3, ..., m), находимые по обычной формуле одномерного дисперсионного анализа
1 k
sBff = S Ni (Mif - Mof)2 , (2.17)
k - 1 i = 1
а внедиагональными элементами являются межгрупповые ковариации для всех попарных сочетаний признаков (f ¹ h)
1 k
sBfh = S Ni (Mif - Mof) (Mih - Moh) (2.18)
k - 1 i = 1
Аналогичным образом, внутригрупповая ковариационная матрица
sW11 sW12 sW13 ... sW1m
WsW12 sW22 sW23 ... sW2m
SW = = sW13 sW23 sW33 ... sW3m (2.19)
N - k ... ... ... ... ...
sW1m sW2m sW3m ... . sWmm
- 25 -
является простой ковариационной матрицей, но опирающейся на данные всех выборок. Ее можно также получить взвешенным усреднением всех ковариационных матриц S1, S2, S3, ..., Sk по всем k выборкам
1 k
SW = S (Ni - 1) Si . (2.20)
N - k i = 1
Такое усреднение, как и вообще получение единой внутригрупповой ковариационной матрицы, возможно только, если для всех выборок наблюдается однородность внутригрупповой изменчивости, т. е. соблюдается так называемая гомоскедастичность. Ковариационные матрицы SB и SW являются многомерными аналогами межгрупповой и внутригрупповой дисперсий одномерного дисперсионного анализа.
Разумеется, формулы (2.17) и (2.18) не слишком удобны для нахождения элементов межгрупповой ковариационной матрицы SB или матрицы сумм B. Для любого диагонального элемента последней - можно использовать формулу
k 1 k 2
bff = S NiMfi2 - S NiMfi .
i = 1 N i = 1
Дата добавления: 2016-02-13; просмотров: 898;