Проверка гипотез о законе распределения
Во многих случаях закон распределения изучаемой случайно величины неизвестен, но есть основания предположить, что он имеет вполне определенный вид: нормальный, биномиальный или какой-либо другой.
Пусть необходимо проверить гипотезу Н0 о том, что случайная величина X подчиняется определенному закону распределения, заданному функцией распределения
, т.е. Н0:
. Под альтернативной гипотезой Н1 будем понимать в данном случае то, что просто не выполнена основная (т.е. Н1:
).
Для проверки гипотезы о распределении случайной величины X проведем выборку, которую оформим в виде статистического ряда:
|
|
|
| … |
|
|
|
|
| … |
|
где
- объем выборки.
Требуется сделать заключение: согласуются ли результаты наблюдений с высказанным предположением. Для этого используем специально подобранную величину - критерий согласия.
Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Он используется для проверки согласия предполагаемого вида распределения с опытными данными на основании выборки.
Существуют различные критерии согласия: Пирсона, Колмогорова, Фишера, Смирнова и др.
Критерий согласия Пирсона - наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения.
Критерий Пирсона
Для проверки гипотезы Н0 поступают следующим образом.
Разбивают всю область значений случайной величины X на m интервалов ∆1, ∆2,..., ∆n и подсчитывают вероятности
попадания случайной величины X в интервал ∆i, используя формулу
.
Тогда теоретическое число значений случайной величины X, попавших в интервал ∆i, можно рассчитать по формуле
. Таким образом, имеем статистический ряд распределения случайной величины X и теоретический ряд распределения:
| ∆1 | ∆2 | … | ∆m |
|
| … |
|
Если эмпирические частоты (
) сильно отличаются от теоретических (
), то проверяемую гипотезу Н0 следует отвергнуть, а в противном случае - принять.
Необходим критерий, характеризующий степень расхождения между эмпирическими и теоретическими частотами. В качестве меры расхождения между
и
К. Пирсон (1857-1936; англ. математик, статик, биолог, философ) предложил величину («критерий Пирсона»):
. (10.1)
Согласно теореме Пирсона, при
статистика имеет
- распределение с
степенями свободы, где m - число групп (интервалов) выборки, r - число параметров предполагаемого распределения. В частности, если предполагаемое распределение нормально, то оценивают два параметра (а и σ), поэтому число степеней свободы
.
Правило применения критерия
сводится к следующему:
1. По формуле (10.1) вычисляют
- выборочное значение статистики критерия.
2. Выбрав уровень значимости а критерия, по таблице
-распределения находим критическую точку (квантиль)
.
3. Если
, то гипотеза Н0 не противоречит опытным данным. Если
то гипотеза Н0 отвергается.
Необходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений, т.е.
. Если в отдельных интервалах их меньше, то число интервалов надо уменьшить путем объединения (укрупнения) соседних интервалов.
Пример 10.8.Измерены 100 обработанных деталей. Отклонения от заданного размера приведены в таблице:
| [-3, -2) | [-2, -1) | [-1,0) | [0,1) | [1,2) | [2,3) | [2,3) | [4,5) |
|
Проверить при уровне значимости
гипотезу
отом, что отклонения от проектного размера подчиняются нормальному закону распределения.
Решение:
Число наблюдений в крайних интервалах меньше 5, поэтому объединим их с соседними. Получим следующий ряд распределения (
):
| [-3, -1) | [-1, -0) | [0,1) | [1,2) | [2,3) | [3,5) |
|
Случайную величину - отклонение - обозначим через X. Для вычисления вероятностей
необходимо вычислить параметры, определяющие нормальный закон распределения
. Их оценки вычислим по выборке:
,
,
.
Находим
. Так как случайная величина
определена на
, то крайние интервалы в ряде распределения заменяем, соответственно, на
и
Тогда
.
Аналогично получаем:
,
,
,
,
.
Полученные результаты приведем в следующей таблице:
| (-∞,-1) | [-1,0) | [0,1) | [1,2) | [2,3) | [3,∞) |
| ||||||
| 13,14 | 16,67 | 22,58 | 21,83 | 15,03 | 10,75 |
Вычисляем
:
.
Находим число степеней свободы. По выборке рассчитаны два параметра, значит,
.
Количество интервалов 6, т.е.
. Следовательно,
.
Зная, что
и
, по таблице
-распределения находим
.
Итак,
, следовательно, нет оснований отвергнуть проверяемую гипотезу.
Дата добавления: 2017-03-29; просмотров: 152;
