Схема проверки нулевой гипотезы .
1. По выборке
строят статистический ряд; он может быть как дискретным, так и интервальным. Рассмотрим для определенности интервальный ряд:
|
|
| … |
|
|
|
|
| … |
|
|
2. По данным предыдущих исследований или по предварительным данным делают предположение (выдвигают гипотезу) о модели закона распределения генеральной совокупности
.
Для предположения модели закона распределения генеральной совокупности
можно использовать графическое представление выборки.
3. Используя выборочные данные, строят оценки параметров выбранной модели закона распределения.
4. Определяют теоретические вероятности попадания случайной величины в интервалы
по формуле
, (9.6.1)
где
— предполагаемая функция распределения генеральной совокупности
.
4. Определяют расчетное значение критерия К. Пирсона по формуле

или
.
5. Выбрав уровень значимости
, находят критическую область (она всегда правосторонняя)
. Границу критической области можно найти одним из следующих:
§ используя таблицы
–распределения с
степенями свободы;
§ используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL, при этом аргумент «вероятность» данной функции должен быть равен уровню значимости, а аргумент «степени_свободы» должен быть равен
;
§ используя функцию qchisq(p, d) из MATHCAD, при этом переменные данной функции должны быть равны:
.
6. Если расчетное значение
попадает в критическую область
, то нулевая гипотеза
отвергается и принимается альтернативная гипотеза.
Замечание.При применении критерия К. Пирсона в каждом интервале должно быть не менее 5 элементов выборки (т.е.
). Если это условие не выполняется, то число интервалов надо уменьшить путем объединения соседних интервалов.
Пример 5.Получены значения случайной величины
.
| 0,54 | 0,7 | 0,66 | 0,55 | 0,57 | 0,56 | 0,62 | 0,65 | 0,5 | 0,67 |
| 0,66 | 0,58 | 0,57 | 0,53 | 0,53 | 0,53 | 0,46 | 0,72 | 0,41 | 0,55 |
| 0,6 | 0,61 | 0,45 | 0,55 | 0,63 | 0,6 | 0,53 | 0,51 | 0,59 | 0,57 |
| 0,59 | 0,64 | 0,66 | 0,56 | 0,59 | 0,58 | 0,55 | 0,55 | 0,53 | 0,53 |
| 0,41 | 0,54 | 0,45 | 0,61 | 0,46 | 0,52 | 0,59 | 0,63 | 0,4 | 0,69 |
| 0,53 | 0,48 | 0,41 | 0,57 | 0,6 | 0,57 | 0,56 | 0,56 | 0,42 | 0,6 |
| 0,54 | 0,59 | 0,56 | 0,5 | 0,46 | 0,62 | 0,57 | 0,42 | 0,72 | 0,47 |
| 0,47 | 0,44 | 0,52 | 0,62 | 0,64 | 0,41 | 0,51 | 0,4 | 0,49 | 0,67 |
| 0,52 | 0,58 | 0,65 | 0,42 | 0,68 | 0,53 | 0,65 | 0,59 | 0,43 | 0,61 |
| 0,56 | 0,62 | 0,7 | 0,49 | 0,7 | 0,55 | 0,5 | 0,52 | 0,71 | 0,48 |
Необходимо:
1. Найти выборочные характеристики: выборочное среднее и исправленную выборочную дисперсию.
2. Построить доверительной вероятностью 0,95 доверительные интервалы для математического ожидания и дисперсии.
3. Построить гистограмму.
4. Проверить гипотезу о нормальном распределении случайной величины
при уровне значимости
.
m Решение.Учитывая, что количество значений равно 100, определяем выборочное среднее и исправленную выборочную дисперсию:
.
.
Замечание.Выборочное среднее можно определить используя функцию СРЗНАЧ(число1; число2; ...) из EXCEL, а исправленную выборочную дисперсию можно определить используя функцию ДИСП(число1;число2; ...) из EXCEL.
Перейдем к построению доверительных интервалов. При построении доверительного интервала для математического ожидания считаем, что при этом дисперсия не известна. Как известно из предыдущей главы, необходимо использовать формулу
,
в которой неизвестна только величина
, являющаяся квантилем
–распределения с
числом степеней свободы. Для доверительной вероятност и
найдем квантиль
‑распределения с
числом степеней свободы. Для этого используем, например, функцию qt(p, d) из MATHCAD:
или функцию СТЬЮДРАСПОБ(вероятность; степени_свободы) из EXCEL:
или Приложение 5.
Определяем точность оценки
.
Таким образом, получаем доверительный интервал
.
Построим доверительный интервал для дисперсии при неизвестном математическом ожидании. В этом случае необходимо использовать формулу
,
где
— квантиль уровня
–распределения с
степенью свободы.
Для данной формулы необходимо вычислить квантили
и
. Используя функцию qchisq(p, d) из MATHCAD, получим:
и
. Аналогичный результат можно получить используя функцию ХИ2ОБР (вероятность;степени_свободы) из EXCEL:
,
.
Таким образом, получаем доверительный интервал

.
Перейдем к построению гистограммы. Построим интервальный ряд. Найдем сначала минимальное и максимальное значения случайной величины (т.е. крайние члены вариационного ряда):
и
. Для нахождения минимального и максимального значений случайной величины можно использовать функции МИН(число1;число2; ...) и МАКС(число1;число2; ...) из EXCEL. Размах варьирования будет равен
.
Возьмем число частичных интервалов
. В этом случае длина частичного интервала равна
.
Соответствующий интервальный ряд приведен в таблице 9.2.
Таблица 9.2
Номер
интервала
| Средний пробег автомобилей
(интервалы)
| Частота
| Относительная частота
|
| 0,4 — 0,44 | 2,5 | ||
| 0,44 — 0,48 | |||
| 0,48 — 0,52 | 2,25 | ||
| 0,52 — 0,56 | 5,25 | ||
| 0,56 — 0,6 | 5,25 | ||
| 0,6 — 0,64 | 3,25 | ||
| 0,64 — 0,68 | 2,5 | ||
| 0,68 — 0,72 |
Гистограмма приведена на рис 9.4.

Проверим гипотезу о распределении случайной величины
. Найдем теоретические вероятности попадания случайной величины в интервалы
по формуле
, где
— функция распределения нормального закона. Так как случайная величина
, подчиненная нормальному закону распределения, определена на
, то крайние интервалы в ряде распределения следует заменить на
и
. Тогда








Дальнейшие вычисления удобно оформить в виде таблицы (табл. 9.3).
Таблица 9.3
| Номер интервала i | средний пробег автомобилей
(интервалы)
| Частота
| Теоретические частоты
|
|
| |
| 0,4 — 0,44 | 0,0749 | 7,49 | 13,3511 | |||
| 0,44 — 0,48 | 0,0962 | 9,62 | 6,6528 | |||
| 0,48 — 0,52 | 0,1517 | 15,17 | 5,3395 | |||
| 0,52 — 0,56 | 0,1932 | 19,32 | 22,8261 | |||
| 0,56 — 0,6 | 0,1859 | 18,59 | 23,7224 | |||
| 0,6 — 0,64 | 0,1466 | 14,66 | 11,5280 | |||
| 0,64 — 0,68 | 0,0872 | 8,72 | 11,4679 | |||
| 0,68 — 0,72 | 0,0643 | 6,43 | 9,9533 | |||
| Итого | 104,8411 |
Определяем расчетное значение критерия К. Пирсона:

Находим число степеней свободы. По выборке были рассчитаны два параметра, значит,
. Количество интервалов 8,т.е.
. Следовательно,
. Зная, что
и
, находим границу правосторонней критической области
(см. Приложение 4). Таким образом, критической областью является интервал
.
Так как расчетное значение критерия К. Пирсона
не попадает в критическую область, то нет оснований отвергнуть проверяемую гипотезу о нормальном законе распределения. l
Дата добавления: 2015-05-28; просмотров: 1270;
