Проверка гипотез о законе распределения
Во многих случаях закон распределения изучаемой случайно величины неизвестен, но есть основания предположить, что он имеет вполне определенный вид: нормальный, биномиальный или какой-либо другой.
Пусть необходимо проверить гипотезу Н0 о том, что случайная величина X подчиняется определенному закону распределения, заданному функцией распределения , т.е. Н0: . Под альтернативной гипотезой Н1 будем понимать в данном случае то, что просто не выполнена основная (т.е. Н1: ).
Для проверки гипотезы о распределении случайной величины X проведем выборку, которую оформим в виде статистического ряда:
… | |||||
… |
где - объем выборки.
Требуется сделать заключение: согласуются ли результаты наблюдений с высказанным предположением. Для этого используем специально подобранную величину - критерий согласия.
Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения. Он используется для проверки согласия предполагаемого вида распределения с опытными данными на основании выборки.
Существуют различные критерии согласия: Пирсона, Колмогорова, Фишера, Смирнова и др.
Критерий согласия Пирсона - наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения.
Критерий Пирсона
Для проверки гипотезы Н0 поступают следующим образом.
Разбивают всю область значений случайной величины X на m интервалов ∆1, ∆2,..., ∆n и подсчитывают вероятности попадания случайной величины X в интервал ∆i, используя формулу
.
Тогда теоретическое число значений случайной величины X, попавших в интервал ∆i, можно рассчитать по формуле . Таким образом, имеем статистический ряд распределения случайной величины X и теоретический ряд распределения:
∆1 | ∆2 | … | ∆m |
… |
Если эмпирические частоты ( ) сильно отличаются от теоретических ( ), то проверяемую гипотезу Н0 следует отвергнуть, а в противном случае - принять.
Необходим критерий, характеризующий степень расхождения между эмпирическими и теоретическими частотами. В качестве меры расхождения между и К. Пирсон (1857-1936; англ. математик, статик, биолог, философ) предложил величину («критерий Пирсона»):
. (10.1)
Согласно теореме Пирсона, при статистика имеет - распределение с степенями свободы, где m - число групп (интервалов) выборки, r - число параметров предполагаемого распределения. В частности, если предполагаемое распределение нормально, то оценивают два параметра (а и σ), поэтому число степеней свободы .
Правило применения критерия сводится к следующему:
1. По формуле (10.1) вычисляют - выборочное значение статистики критерия.
2. Выбрав уровень значимости а критерия, по таблице -распределения находим критическую точку (квантиль) .
3. Если , то гипотеза Н0 не противоречит опытным данным. Если то гипотеза Н0 отвергается.
Необходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений, т.е. . Если в отдельных интервалах их меньше, то число интервалов надо уменьшить путем объединения (укрупнения) соседних интервалов.
Пример 10.8.Измерены 100 обработанных деталей. Отклонения от заданного размера приведены в таблице:
[-3, -2) | [-2, -1) | [-1,0) | [0,1) | [1,2) | [2,3) | [2,3) | [4,5) | |
Проверить при уровне значимости гипотезу отом, что отклонения от проектного размера подчиняются нормальному закону распределения.
Решение:
Число наблюдений в крайних интервалах меньше 5, поэтому объединим их с соседними. Получим следующий ряд распределения ( ):
[-3, -1) | [-1, -0) | [0,1) | [1,2) | [2,3) | [3,5) | |
Случайную величину - отклонение - обозначим через X. Для вычисления вероятностей необходимо вычислить параметры, определяющие нормальный закон распределения . Их оценки вычислим по выборке:
,
,
.
Находим . Так как случайная величина определена на , то крайние интервалы в ряде распределения заменяем, соответственно, на и Тогда
.
Аналогично получаем:
, , , , .
Полученные результаты приведем в следующей таблице:
(-∞,-1) | [-1,0) | [0,1) | [1,2) | [2,3) | [3,∞) | |
13,14 | 16,67 | 22,58 | 21,83 | 15,03 | 10,75 |
Вычисляем :
.
Находим число степеней свободы. По выборке рассчитаны два параметра, значит, .
Количество интервалов 6, т.е. . Следовательно, .
Зная, что и , по таблице -распределения находим .
Итак, , следовательно, нет оснований отвергнуть проверяемую гипотезу.
Дата добавления: 2017-03-29; просмотров: 99;