Лекция № 25-26. Элементы регрессионного анализа. Определение параметров линейной и нелинейной регрессии методом наименьших квадратов.
Проверка статистических гипотез
Лекция № 23-24. Проверка статистических гипотез. Критерий χ2 и его применение к проверке гипотез о виде распределения.
План.Статистическая гипотеза, критерий, критическая область и критическая точка. Ошибки первого и второго рода. Правила проверки статистической гипотезы. Критерий - Пирсона для проверки гипотез о виде законов распределения дискретных и плотностей распределения непрерывных случайных величин.
Основные понятия
Статистической гипотезой называют гипотезу (предположение) о виде неизвестных случайных величин или об их параметрах. Например, «неизвестная величина имеет нормальный закон распределения» или «дисперсии двух случайных величин совпадают». Основную проверяемую гипотезу обычно обозначают через , а альтернативную ей гипотезу, состоящую в том, что не имеет места - через .
Для проверки гипотез используют выборки соответствующих случайных величин. Функция наблюдаемых значений случайной величины (вариант выборки), служащая для проверки гипотезы называется критерием. Эта функция есть случайная величина вида , где - выборка исследуемой величины .
На числовой оси выберем критическую область S, при попадании в которую значения критерия K, гипотеза отвергается. Такая область называется критической областью, а точки ее границы называются критическими точками. Чаще всего рассматриваются критические области следующего вида
- правосторонняя область,
- левосторонняя область,
- двусторонняя область.
При проверке гипотезы с помощью критерия K и области S возможны ошибки двух видов. Ошибкой первого рода называется событие, состоящее в том, что при условии справедливости гипотезы , значение критерия K попадает в S, т.е. верная гипотеза отвергается. Вероятность этой ошибки называется риском первого рода:
Ошибкой второго рода называется событие, состоящее в том, что при условии справедливости альтернативной гипотезы , критерий K не попадает в S, т.е. неверная гипотеза принимается. Вероятность этой ошибки называется риском второго рода:
.
В экономике эти ошибки и риски называются соответственно ошибкой (риском) продавца и покупателя.
Основной гипотезой продавца является гипотеза о том, что имеющаяся у него партия товара качественная. Пусть на основании выборки из этой партии и ее проверки, продавец делает вывод, что эта партия некачественная, хотя на самом деле качество всей партии лежит в пределах нормы. В этом случае продавец уничтожает свою партию качественного товара, т.е. совершает ошибку первого рода.
Основной гипотезой покупателя является гипотеза о том, что приобретаемая им партия товара окажется качественной. Покупатель осуществляет выборку из этой партии и на основании критерия K делает заключение, что эта партия качественная, хотя качество всей партии не удовлетворяет требованиям нормы. В этом случае покупатель покупает партию некачественного товара, т.е. совершает ошибку второго рода.
В общем случае правила проверки статистической гипотезы следующие.
1. Задается максимальная величина риска первого рода - уровень значимости . Это число зависит от решаемой задачи и обычно принимает значения 0,1; 0,01; 0,001 и т.д.
2. Для этого определяется критическая область и ее границы – критические точки таким образом, чтобы риск второго рода был минимальным. Эта задача для каждого критерия решается заранее, и критические точки задаются с помощью таблиц.
3. Производится выборка значений случайной величины и вычисляется значение критерия. Если то гипотеза отвергается, если то эта гипотеза принимается.
5.2. Критерий - Пирсона
Этот критерий служит для проверки гипотез о виде законов распределения дискретных и плотностей распределения непрерывных случайных величин с помощью выборок таких величин достаточно больших объемов.
Случайной величиной (хи квадрат) с k степенями свободы называется величина , где - независимые нормальные нормированные случайные величины. С ростом k эта величина медленно приближается к нормальной случайной величине.
1) Дискретный случай. Пусть имеется дискретная величина X с конечным законом распределения вероятностей
… | ||||
… |
и выборка объема n этой величины со статистическим распределением частот:
xi | … | |||
… |
Известно, что для любой такой дискретной величины X при n стремящемся к бесконечности, величины
стремятся к величине с степенями свободы. Если же закон распределения X зависит от параметров, которые определяются по той же выборке с помощью метода максимального правдоподобия, то число степеней свободы равно .
Здесь мы для простоты не уточняем характер сходимости указанной величины к . Для больших n величину можно приближенно считать равной , поэтому ее и используют для проверки гипотезы о том, соответствует ли исследуемая выборка случайной величине с заданным законом распределения. Порядок проверки этой гипотезы следующий.
1. Для заданного значения уровня и числа степеней свободы по таблице критических точек распределения определяем критическую точку для правосторонней области.
2. По статистическому распределению выборки вычисляем значение критерия .
3. Если , то проверяемая гипотеза отвергается, иначе она принимается.
Замечание. Этот критерий можно применять в случае, когда все частоты статического распределения достаточно велики в противном случае следует объединить соседние столбцы закона распределения и статистического распределения таким образом, чтобы это требование выполнялось. При этом необходимо соответственно уменьшить число степеней свободы k.
2) Непрерывный случай. Пусть проверяется гипотеза о том, что плотность случайной величины имеет вид непрерывной функции , где - некоторые параметры, значения которых неизвестны. Для проверки гипотезы берется выборка объема n этой величины и по ней строится распределение частот по r промежуткам, заполняющим всю область определения вида
… | ||||
… |
Здесь .
По той же выборке методом максимального правдоподобия производится оценка неизвестных параметров - и для этих значений находятся теоретические вероятности попадания значения величины в определенные выше промежутки
.
Можно доказать, чтодля любой непрерывной величины при n стремящемся к , величина
стремится к величине с степенями свободы.
Правила применения критерия для проверки указанной гипотезы те же, что и выше. Все значения ni должен быть , в противном случае следует объединить соседние промежутки.
Этот критерий можно применить, например, для проверки гипотезы о нормальном виде распределения мощностей песчаных пробок образующихся в скважинах по выборке таких мощностей объема n.
Выводы. По данной теме нами были рассмотреныпонятия статистической гипотезы, критерия, критической области и критических точек. Определено понятие ошибок первого и второго рода и правила проверки статистической гипотезы. Рассмотрен критерий - Пирсона для проверки гипотез о виде законов распределения дискретных и плотностей распределения непрерывных случайных величин.
Лекция № 25-26. Элементы регрессионного анализа. Определение параметров линейной и нелинейной регрессии методом наименьших квадратов.
План. Основные понятиякорреляционного анализа. Виды зависимостей между случайными величинами. Функции регрессии. Выборочные функции регрессии и их нахождение методом наименьших квадратов. Линейная и параболическая функции регрессии.
Дата добавления: 2015-10-21; просмотров: 874;