Проверка гипотез о равенстве векторов средних в двух совокупностях

 

2.3 В одномерной биометрии часто встречалась задача, определения степени случайности различий средних арифметических величин, найденных в двух выборках с объемами N1 и N2, которые были получены из двух генеральных совокупностей. В этом случае в каждой из выборок можно было иметь средние величины M1 и M2 и средние квадратические отклонения s1 и s2. Нулевая гипотеза заключалась в предположении о равенстве средних арифметических величин в генеральных совокупностях, альтернативная гипотеза предполагала отсутствие такого равенства. Выбор из этих двух возможностей проводился с использованием t-критерия Стьюдента

M1 - M2

t = ,

1 1 1 / 2

s +

N1 N2

где s - некая усредненная оценка среднего квадратического отклонения, полученная по двум выборкам. Усреднение было возможным, если различия двух выборок в уровне вариации были случайными и осуществлялось по формуле

 

(N1 - 1) s12 + (N2 - 1) s22 1 / 2

s = .

N1 + N2 - 2

- 20 -

2.4 В многомерном случае (m признаков) эта задача касается уже не отдельных средних величин, а превращается в проверку случайности различий двух векторов средних M1 и M2, найденных в двух выборках с объемами N1 и N2, которые были получены из двух генеральных совокупностей. Одновременно в этих выборках можно получить ковариационные матрицы S1 и S2. Нулевая гипотеза заключается в предположении того, что в двух генеральных совокупностях различия векторов средних отсутствуют, и наблюдаемые расхождения элементов векторов M1 и M2 носят случайный характер. Альтернативная гипотеза допускает наличие неоднородности векторов средних в генеральных совокупностях.

Для проверки подобной гипотезы применяется многомерный аналог t-крите-рия Стьюдента. Возведем его в квадрат и выпишем полученный результат в виде

N1N2

t2 = (M1 - M2)(s2)-1(M1 - M2)

N1 + N2

Если в этой формуле провести замену средних величин и дисперсии на их многомерные аналоги - векторы средних и ковариационную матрицу, можно получить так называемую T2-статистику Хотеллинга

N1N2

T2 = (M1 - M2)' S-1(M1 - M2) . (2.3)

N1 + N2

Входящая в нее общая ковариационная матрица S может быть получена усреднением по формуле

S = (N1 - 1) S1 + (N2 - 1) S2 . (2.4)

N1 + N2 - 2

Разумеется, такое усреднение может быть правомочным, если не было установлено различий в ковариационных матрицах S1 и S2 . Способ такой проверки изложен ниже в разделе 2.9. Нетрудно видеть, что формула (2.3) обращается в квадрат t-критерия Стьюдента, когда рассматривается только один признак (m = 1).

Доказано, что величина

N1 + N2 - m - 1

F = T2 , (2.5)

(N1 + N2 - 2)

имеет F-распределение Фишера с числами степеней свободы n1 = m и n2 = N1 + N2 - - m - 1. Таким образом, для принятия решения о нулевой гипотезе следует по таблицам F-распределения для данных чисел степеней свободы и принятого уровня вероятности ошибки 1-го рода найти критическое значение критерия Fo. Если найденная по формуле (2.5) величина F < Fo, то нулевую гипотезу можно сохранить как согласующуюся с эмпирическими данными. В ситуации F > Fo ее придется отвергнуть в пользу альтернативы.

Во многих компьютерных программах для найденного по формуле (2.5) значения F-критерия можно получить P - долю его выборочного распределения, лежащую справа от этого значения. Тогда, при P > a (a = 0.05, 0.01, 0.001) нулевая гипотеза может быть принята, а при P < a - отвергнута.

- 21 -

Таблица 2.2.Результаты проверки случайности различий по некоторым скелетным размерам тела у 12-летних девочек Москвы, обследованных в 1968 и 1972 гг.

 

Признаки Средние (мм) t-критерий Степени cво-боды P  
 
1968 г. 1972 г.  
1.Длина тела 1475.8 1498.0 1.86 0.064  
2.Длина ноги 837.8 857.7 2.61* 0.010*  
3.Длина руки 479.1 490.6 2.41* 0.017*  
4.Акромиальный диаметр 316.0 323.8 2.86* 0.005*  
5.Тазогребневой диаметр 240.6 245.5 1.79 0.075  

 

Пример 2.2 Рассмотрим сравнение двух выборок девочек 12-лет, обследованных в школах-интернатах г.Москвы В.С.Соловьевой с соавторами (1976) в 1968 и 1972 гг. Проверим гипотезу о продолжении процессов эпохального увеличения размеров тела и о возможности уловить их проявление даже на столь небольшом временном отрезке.

Рассматривались пять скелетных размеров тела (табл.2.2). Длина ноги оценивалась как высота над полом передней остисто-подвздошной точки, длина руки определялась как сумма продольных размеров плеча и предплечья. В таблице 2.2 приведены значения средних арифметических величин в двух группах девочек 12 лет и результаты проверки гипотезы отсутствия различий по каждому отдельному признаку. Нетрудно видеть, что за 4 года все признаки увеличились, причем для продольных размеров конечностей и ширины плеч эти различия могут считаться неслучайными, так как вероятности ошибки 1-го рода (P) для них оказались меньшими уровня 0.05.

Для T2-статистики Хотеллинга найдена величина T2 = 13.95, значение F-критерия для которой - 2.7193. Для чисел степеней свободы n1 = 5 и n2 = 152 вероятность ошибки 1-го рода P = 0.022 оказывается меньше уровня a = 0.05 и нулевая гипотеза об однородности векторов средних должна быть отклонена. Таким образом, две выборки девочек 12 лет, обследованные в 1968 и 1972 гг. в Москве неслучайно различаются по комплексу скелетных размеров тела. Этот вывод справедлив и для всего набора признаков, и для некоторых из них, рассматриваемых отдельно.

 








Дата добавления: 2016-02-13; просмотров: 662;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.008 сек.