Статистическая гипотеза. Статистический критерий
Под статистической гипотезой (или просто гипотезой) понимается всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.
Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (это так называемые параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).
Одну из гипотез выделяют в качестве основной (или нулевой) и обозначают
, а другую, являющуюся логическим отрицанием
, т.е. противоположную
- в качестве конкурирующей (или альтернативной) гипотезы и обозначают
.
Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой (в ней речь идет об одном значении параметра), в противном случае – сложной.
Например, гипотеза
, состоящая в том, что математическое ожидание случайной величины
равно
, то есть
, является простой. В качестве альтернативной гипотезы можно рассматривать одну из следующих гипотез:
(сложная гипотеза),
(сложная),
(сложная) или
(простая гипотеза).
Имея две гипотезы
и
, надо на основе выборки
,
,…,
принять либо основную гипотезу
, либо конкурирующую
.
Правило, по которому принимается решение принять или отклонить гипотезу
(соответственно отклонить или принять гипотезу
), называется статистическим критерием (или просто критерием) проверки гипотезы
.
Проверку гипотез осуществляют на основании результатов выборки
,
,…,
, из которых формируют функцию выборки
,
,…,
, называемой статистикой критерия.
Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия
разбивается на два непересекающихся подмножества: критическую область
, то есть область отклонения гипотезы и область
принятия этой гипотезы. Если фактически наблюдаемое значение статистики критерия (то есть значение критерия, вычисленное по выборке:
,
,…,
) попадает в критическую область
, то основная гипотеза
отклоняется и принимается альтернативная гипотеза
; если же
попадает в
, то принимается
, а
отклоняется.
При проверке гипотезы может быть принято неправильное решение, то есть могут быть допущены ошибки двух родов:
Ошибка первого рода состоит в том, что отвергается нулевая гипотеза
, когда на самом деле она верна.
Ошибка второго рода состоит в том, что отвергается альтернативная гипотеза
, когда она на самом деле верна.
Рассматриваемые случаи наглядно иллюстрирует следующая таблица:
Гипотеза
| Отвергается | Принимается |
| верна неверна | ошибка 1-го рода правильное решение | правильное решение ошибка 2-го рода |
Вероятность ошибки первого рода (обозначается через
) называется уровнем значимости критерия.
Очевидно,
. Чем меньше
, тем меньше вероятность отклонить верную гипотезу. Допустимую ошибку первого рода обычно задают заранее.
В одних случаях считается возможным пренебречь событиями, вероятность которых меньше 0,05 (
означает, что в среднем в 5 случаях из 100 испытаний верная гипотеза будет отвергнута), в других случаях, когда речь идет, например, о разрушении сооружений, гибели судна и т.п., нельзя пренебречь обстоятельствами, которые могут появиться с вероятностью, равной 0,001.
Обычно для
используются стандартные значения:
;
; 0,005; 0,001.
Вероятность ошибки 2-го рода обозначается через
, то есть
. Величину
, то есть вероятность недопущения ошибки второго рода (отвергнуть неверную гипотезу
, принять верную
) называется мощностью критерия.
Очевидно,
,
,…,
.
Чем больше мощность критерия, тем вероятность ошибки 2-го рода меньше, что, конечно, желательно (как и уменьшение
).
Последствия ошибок 1-го, 2-го рода могут быть совершенно различными: в одних случаях надо минимизировать
, в других -
. Так, применительно к производству, к торговле, можно сказать, что
риск поставщика (то есть забраковка по выборке всей партии изделий, удовлетворяющих стандарту),
риск потребителя (то есть прием по выборке всей партии изделий, не удовлетворяющих стандарту); применительно к судебной системе, ошибка 1-го рода приводит к оправданию виновного, ошибка 2-го рода – к осуждению невиновного.
Отметим, что одновременное уменьшение ошибок 1-го и 2-го рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимости
отыскивается критерий с наибольшей мощностью.
Методика проверки гипотез сводится к следующему:
1. Располагая выборкой
, формируют нулевую гипотезу
и альтернативную
.
2. В каждом конкретном случае подбирают статистику критерия
, обычно из нижеперечисленных:
нормальное распределение,
распределение хи-квадрат Пирсона,
распределение Стьюдента.
3. По статистике критерия
и уровню значимости
определяют критическую область
(и
). Для ее отыскания достаточно найти критическую точку
, то есть границу, отделяющую
от
.
Границы областей определяются соответственно из соотношений:
для правосторонней критической области
(рис. 5);

Рис. 5.Правосторонняя критическая область
для левосторонней критической области
(рис. 6);

Рис. 6. Левосторонняя критическая область
для двусторонней критической области
(рис. 7)

Рис. 7. Двусторонняя критическая область
Для каждого конкретного случая имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую приведенным выше соотношениям.
4. Для полученной реализации выборки
подсчитывают значение критерия, то есть
.
5. Если
(например,
для правосторонней области
), то нулевую гипотезу
отвергают; если же
(
), то нет оснований, чтобы отвергнуть гипотезу
.
Дата добавления: 2016-04-22; просмотров: 2346;
