ПРОВЕРКА ГИПОТЕЗЫ О РАВЕНСТВЕ ДВУХ ГЕНЕРАЛЬНЫХ СРЕДНИХ

Рассмотрим две независимые выборки x_1,x₂, ….. , x_n и y₁, y₂ , … , y_n, извлеченные из нормальных генеральных совокупностей с одинаковыми дисперсиями , причем объемы выборок соответственно n и m, а средние μ_x, μ_y и дисперсия σ² неизвестны. Требуется проверить основную гипотезу Н₀: μ_x=μ_y при конкурирующей Н₁: μ_x μ_y.

Как известно, выборочные средние и будут обладать свойствами: ~N(μ_x, σ²/n), ~N(μ_y, σ²/m).

Их разность - нормальная величина со средним и дисперсией , так что

~ (23).

Допустим на время, что основная гипотеза Н₀ верна: μ_x–μ_y=0. Тогда и, деля величину на ее стандартное отклонение, получим стандартную нормальную сл. Величину ~N(0,1).

Раньше отмечалось, что сл. величина распределена по закону с (n-1)-ой степенью свободы, a - по закону с (m-1) степенью свободы. С учетом независимости этих двух сумм, получаем, что их общая сумма распределена по закону с n+m-2 степенями свободы.

Вспоминая п.7, видим, что дробь подчиняется t-распределенню (Стьюдента) с ν=m+n-2 степенями свободы: Z=t. Этот факт имеет место только тогда, когда истинна гипотеза Н₀.

Заменяя ξ и Q их выражениями, получим развернутую форнулу для Z:

(24)

Сл.величина Z, называемая статистикой критерия, позволяет принять решение при такой последовательности действий:

1. Устанавливается область D=[-t_β,ν, +t_β,ν], содержащая β=1–α площади под кривой t_ν–распределения (табл.10).

2. Вычисляется по формуле (24) опытное значение Z_on статистики Z, для чего вместо X₁ и Y₁ подставляются значения x₁ и y₁конкретных выборок, а также их выборочные средние и .

3. Если Z_on D, то гипотеза Н₀ считается не противоречащей опытным данным и принимается.

Если Z_on D, то принимается гипотеза Н₁.

Если гипотеза Н₀ верна, то Z подчиняется известному t_ν–распределению с нулевым средним и с высокой вероятностью β=1–α попадает в D-область принятия гипотезы Н₀. Когда наблюдаемое, опытное значение Z_on попадает в D. Мы рассматриваем это как свидетельство в пользу гипотезы Н₀.

Когда жe Z₀_n лежит за пределами D (как говорят, лежит в критической области К), что естественно, если верна гипотеза Н₁, но маловероятно, если верна Н₀, то нам остается отклонить гипотезу Н₀, приняв H₁.

Пример 31.

Сравниваются две марки бензина: А и В. На 11 автомашинах одинаковой мощности по кольцевому шассе испытан по разу Бензин марки А и В. Одна машина в пути вышла из строя н для нее данные по бензину В отсутствуют.

Расход бензина в пересчете на 100 км пути

Таблица 12

i
X_i	10,51	11,86	10,5	9,1	9,21	10,74	10,75	10,3	11,3	11,8	10,9	n=11
У_i	13,22	13,0	11,5	10,4	11,8	11,6	10,64	12,3	11,1	11,6	-	m=10

Дисперсия расхода бензина марок А и В неизвестна и предполагается одинаковой. Можно ли при уровне значимости α=0,05 принять гипотезу о том, что истинные средние расходы μ_А и μ_В этих видов бензина одинаковы?

Решение. Проверку гипотезы Н₀: μ_А-μ_В=0 при конкурирующей. Н₁:μ₁ μ₂ делаем по пунктам:

1. Находим выборочные средние и сумму квадратов отклонений Q.

;

2. Вычисляем опытное значение статистики Z

3. Находим из таблицы 10 t-распределения предел t_β,ν, для числа степеней свободы ν=m+n–2=19 и β=1–α=0.95. В таблице 10 есть t_0.95.20=2,09 и t_0.95.15=2,13, но нет t_0.95.19. Находим интерполяцией t_0.95.19=2,09+ =2,10.

4. Проверяем, в какой из двух областей D или К лежит число Z_on. Zon=-2,7 D=[-2,10; -2,10].

Поскольку наблюденное значение Z_on лежит в критической области, К=R\D, то отбрасываем. Н₀ и приникаем гипотезу Н₁. В этом случае про и говорят, что их разность значима. Если бы при всех условиях этого примера изменилось бы лишь Q, скажем, Q вдвое возросло, то изменился бы и наш вывод. Увеличение Q вдвое привело бы к уменьшению в раза величины Z_on и тогда число Zon попало бы в допустимую область D, так что гипотеза H₀ выдержала бы проверку и была принята. В этом случае расхождение между и объяснялось бы естественным разбросом данных, а не тем, что μ_А μ_В.

Теория проверки гипотез весьма обширна, гипотезы могут быть о виде закона распределения, об однородности выборок, о независимости сл.величины и т.д.

КРИТЕРИЙ c² (ПИРСОНА)

Самый распространенный на практике критерий проверки простой гипотезы. Применяется, когда закон распределения неизвестен. Рассмотрим случайную величину X, над которой проведено n независимых испытаний. Получена реализация x₁, x₂,...,x_n. Необходимо проверить гипотезу о законе распределения этой случайной величины.

Рассмотрим случай простой гипотезы. Простая гипотеза проверяет согласование выборки с генеральной совокупностью, имеющей нормальное распределение (известное). По выборкам строим вариационный ряд x⁽¹⁾, x⁽²⁾, ..., x⁽ⁿ⁾. Интервал [x⁽¹⁾, x⁽ⁿ⁾] разбиваем на подинтервалы. Пусть этих интервалов r. Тогда найдем вероятность попадания X в результате испытания в интервал Di, i=1 ,..., r в случае истинности проверяемой гипотезы.

Критерий проверяет не истинность плотности вероятности, а истинность чисел

p_i=P(XÎDi)

С каждым интервалом Di свяжем случайное событие A_i - попадание в этот интервал (попадание в результате испытания над X ее результата реализации в Di). Введем случайные величины. m_i - количество испытаний из n проведенных, в которых произошло событие A_i. m_i распределены по биномиальному закону и в случае истинности гипотезы

Mm_i=np_i

Dm_i=np_i(1-p_i)

Критерий c² имеет вид

p₁+p₂+...+p_r=1

m₁+m₂+...+m_r=n

Если проверяемая гипотеза верна, то m_i представляет частоту появления события, имеющего в каждом из n проведенных испытаний вероятность p_i, следовательно, мы можем рассматривать m_i как случайную величину, подчиняющуюся биномиальному закону с центром в точке np_i. Когда n велико, то можно считать, что частота распределена асимптотически нормально с теми же параметрами. При правильности гипотезы следует ожидать, что будут асимптотически нормально распределены

связанные между собой соотношением

В качестве меры расхождения данных выборки m₁+m₂+...+m_r с теоретическими np₁+np₂+...+np_r рассмотрим величину

c² - сумма квадратов асимптотически нормальных величин, связанных линейной зависимостью. Мы ранее встречались уже с аналогичным случаем и знаем, что наличие линейной связи привело к уменьшению на единицу числа степеней свободы.

Если проверяемая гипотеза верна, то критерий c² имеет распределение, стремящееся при n®¥ к распределению c² с r-1 степенями свободы.

Допустим, что гипотеза неверна. Тогда существует тенденция к увеличению слагаемых в сумме, т.е. если гипотеза неверна, то эта сумма будет попадать в некую область больших значений c². В качестве критической области возьмем область положительных значений критерия

В случае неизвестных параметров распределения каждый параметр уменьшает на единицу количество степеней свободы для критерия Пирсона

<5 6 7 8910 11 >

Дата добавления: 2016-02-27; просмотров: 1101;