Проверка гипотезы о равенстве нескольких ковариационных матриц
2.8 Равенство ковариационных матриц в нескольких генеральных совокупностях является условием применения многих многомерных статистических методов. Например, вычисление T2-статистики Хотеллинга или нахождение единой матрицы W, описывающей внутригрупповую вариацию для дальнейшего ее использования в критерии Уилкса, опирается на предположение того, что внутривыборочная изменчивость во всех сравниваемых группах населения характеризуется сходными дисперсиями и ковариациями признаков.
В одномерном случае для подобных целей использовался так называемый критерий Бартлетта. Пусть в нашем распоряжении имеется k выборок с числами наблюдений в них N1, N2, N3, ...,Nk. Для каждой из них по некоторому признаку X
- 29 -
были найдены средние квадратические отклонения s 1, s2, s3, ..., sk . Нулевая гипотеза заключалась в предположении того, что во всех генеральных совокупностях характерен сходный уровень изменчивости, а наблюдаемые по выборкам различия средних квадратических отклонений имеют случайный характер. Для проверки этого предположения использовалась величина
k k
M = 2.3026 S Ni - k lg s2 - S (Ni - 1) lg si2 ,
i = 1 i = 1
где дисперсия s2 находилась усреднением с учетом объемов выборок
1 k
s2 = S (Ni - 1) si2 .
k i = 1
S (Ni - 1)
i = 1
В дополнение к величине критерия Бартлетта вычислялся поправочный коэффициент
1 k 1 1
C = S - + 1 ,
3(k - 1) i = 1 Ni - 1 k
S Ni - k
i = 1
зависевший от объемов и числа выборок. Отношение M/C в случае справедливости предположения об однородности дисперсий имеет распределение c2 с числом степеней свободы n = k - 1, что позволяло проверять обоснованность этого предположения.
2.9 В многомерной ситуации исходные данные выглядят следующим образом. Имеются k выборок с числами наблюдений N1, N2, N3, ...,Nk . Для каждой из них по набору m признаков X1, X2, X3, ...,Xm были найдены ковариационные матрицы S1, S2, S3, ...,Sk. Необходимо проверить гипотезу о равенстве этих матриц в k генеральных совокупностях. Для этой цели используется многомерная форма критерия Бартлетта.
Вид самого критерия по существу не изменился по сравнению с одномерной ситуацией. Вместо значений дисперсий отдельного признака вводятся их многомерные аналоги - определители ковариационных матриц. Как мы видели в разделе 1.5, определитель ковариационной матрицы является так называемой обобщенной дисперсией, описывающей интегративную величину вариации набора признаков. Величина многомерного критерия Бартлетта находится по формуле
k k
M = 2.3026 S Ni - k lg ½S½ - S (Ni - 1) lg ½S i½ , (2.28)
i = 1 i = 1
где ковариационная матрица S получается усреднением
- 30 -
1 k
S = S (Ni - 1) S i . (2.29)
k i = 1
S (Ni - 1)
i = 1
Вычисляется также вспомогательная величина-поправка
(2m2 + 3m – 1) k 1 1
C = 1 - S - , (2.30)
6(m + 1)(k - 1) i = 1 Ni - 1 k
S Ni - k
i = 1
Для больших выборок C » 1. В случае, когда гипотеза о равенстве ковариационных матриц в k генеральных совокупностях справедлива, произведение MC имеет распределение c2 с числом степеней свободы n = (k - 1)(m+1)m/2. Таким образом, по таблицам распределения c2 следует для конкретного числа степеней свободы и уровня вероятности ошибки 1-го рода a (0.05, 0.01 и 0.001) найти критическое значение c2o. При c2 > c2o можно считать, что предположение об однородности ковариационных матриц не согласуется с эмпирическими материалами, и закономерности вариации в k генеральных совокупностях различны. При c2 < c2o наличие достоверных различий ковариационных матриц остается недоказанным. Во многих пакетах компьютерных программ одновременно с нахождением значения критерия Бартлетта и величины c2o находится P - вероятность ошибки 1-го рода, которая соответствует этой величине. Тогда при P < a (0.05, 0.01 и 0.001) можно сделать вывод об отсутствии однородности ковариационных матриц.
При использовании критерия Бартлетта необходимо помнить о том, что он весьма чувствителен к отклонениям от нормальности распределения признаков. В случае асимметричного распределения признаков, входящих в исследуемый набор, неоднородность ковариационных матриц может устанавливаться и в тех случаях, когда этого на самом деле нет.
Дата добавления: 2016-02-13; просмотров: 1900;