Интервальные оценки

Любая точечная оценка является функцией выборки, то есть является случайной величиной, а при каждой реализации выборки эта функция определяет единственное значение оценки, принимаемое за приближаемое значение оцениваемой характеристики.

При этом надо принимать во внимание, что в каждом конкретном случае значение оценки может отличаться от значения параметра, поэтому желательно было бы знать и возможную погрешность, возникающую при использовании предлагаемой оценки, например, указывая такой интервал (или область в случае векторного (неодномерного) параметра), внутри которого с высокой (т. е. близкой к 1) вероятностью находится истинное значение оцениваемого параметра. При таком подходе говорят об интервальном или доверительном оценивании. Основная цель при

этом состоит в том, чтобы при заданном доверительном уровне, построить

кратчайший интервал, обеспечивающий наиболее точную локализацию оцениваемой характеристики.

То есть, в некоторых случаях оказывается более важным установить не конкретное число – кандидата на значение неизвестного параметра (точечное оценивание), а указать интервал, в котором с некоторой вероятностью находится искомое неизвестное значение параметра.

Границы этого интервала, называемого доверительным, строятся по выборке, то есть являются оценками (интервальными) данного параметра.

 

Итак, мы хотим найти такие статистики * (Х1… ,Хn (верхняя доверительная граница) и * (Х1… ,Хn ) (нижняя доверительная граница), чтобы с вероятностью α выполнялось равенство

P * (Х1… ,Хn ) ≤ θ ≤ * (Х1… ,Хn ) = α, то есть с заданной вероятностью значение параметра попадало бы в полученный интервал.

Замечание 24.12. Α в разных источниках называется коэффициентом доверия, уровнем доверия, доверительной вероятностью, надежностью.

Замечание 24.13. Иногда задача формулируется немного по-другому: требуют выполнения с вероятностью α неравенства

P ( * (Х1… ,Хn ) ≤ θ ≤ * (Х1… ,Хn )≥ α, то есть вероятность попасть в интервал для параметра должна быть не меньше α

Сначала задается доверительная вероятность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал ( *, *) достаточно высока. Число ( *+ *)/ 2 – середина доверительного интервала – будет давать значение параметра θ с точностью ( * - *)/ 2, которая представляет собой половину длины доверительного интервала.

 

Таким образом, границы доверительного интервала будут зависеть не только от самих наблюдений, но и от их числа n и заданной доверительной вероятности α.

 

 

Определение 24.11

Таким образом, доверительным (для оценки параметра θ, отвечающим доверительной вероятности α) называется такой интервал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы его θ* и θ* будут зависеть от α и от числа наблюдений n

 

 

Замечание 24.14. Как и в случае точечных оценок, получаемые оценки (границы интервала) тем ближе к параметру с тем большей вероятностью, чем больше объем выборки (Напомним, что все характеристики качества оценок рассматриваются при n→∞)

 

Пример 24.9. Пусть θ – среднее значение предела прочности некоторого материала, которое оценивают независимо друг от друга в каждой из N различных лабораторий по результатам n независимых испытаний. Иначе говоря, среднее значение предела прочности в каждой лаборатории оценивают по собственным экспериментальным данным, представленным выборкой объема n, и в каждой лаборатории получают свои значения верхней и нижней границ α-доверительного интервала

 

Возможны случаи, когда α-доверительный интервал для параметра θ не накрывает его истинного значения. Если М – число таких случаев, то при больших значениях N должно выполняться приближенное равенство α =(N – M)/N. Таким образом, если опыт – получение выборки объема n в лаборатории, то уровень доверия α – доля тех опытов ( при их многократном независимом повторении), в каждом из которых α-доверительный интервал накрывает истинное значение оцениваемого параметра.

 

Напоминание. Оценка (Х1… ,Хn ) называется асимптотически нормальной с дисперсией Δ2, если

( q ) сходится при n →∞ по распределению к стандартному нормальному закону (нормальное распределение при нулевом математическом ожидании и дисперсии, равной 1)

 

 

Асимптотически нормальными являются выборочное среднее, дисперсия, моменты

 

Замечание 24.15.

Построение доверительного интервала основано на определении функции распределения и ее важнейшем свойстве функции распределения: вероятность того, что случайная величина примет значение из промежутка (х1; х2) равна приращению функции распределения на этом промежутке. P(x1 £Х < x2) = F(x2) – F(x1)

Кроме того напомним, что FХ (α) = P(Х < α). В частности, если некоторая величина имеет стандартное нормальное распределение с функцией распределения N(x), P(x1 £Х < x2) = N(x2) – N(x1) и NХ (α) = P(Х < α), где

, а - функция Лапласа

1. Доверительные интервалы для неизвестного математического ожидания m=E(X) при известной дисперсии σ2= DX

 

Согласно свойству асимптотической нормальности выборочного среднего имеем , то есть приблизительно равна функции распределения нормального закона.

Тогда для любого z>0

 

 

 

эквивалентно где функция распределения нормального закона

 

 

выражается через функцию Лапласа

 

 

Получим ввиду нечетности функции Лапласа

 

Поскольку, как уже говорилось (Лекция 19) для функции Лапласа существуют таблицы, можно взять в качестве z zα – ее квантиль порядка α .

 

2. Доверительные интервалы для неизвестного математического ожидания m=E(X) при неизвестной дисперсии σ2= DX

Проведя аналогичные рассуждения, можно воспользоваться последней формулой, взяв в качестве σ корень из выборочной дисперсии , где

 

 

 

Тогда мы получим аналогичное приближение

и аналогичный интервал

 

 

Замечание 24.16

В построениях мы использовали свойство асимптотической нормальности, то есть допущение n→∞. На практике это означает требование большого размера выборки.

 

Если мы будем рассматривать исходную случайную величину с нормальным законом распределения, тогда можно построить доверительный интервал с вероятностью, ровно равной α, поскольку тут нет необходимости в асимптотических формулах и имеет место «удобное» нормальное распределение. Соответственно, n может быть относительно небольшим.

положим

 

В случае, если рассматривается выборка из нормального закона, для построения доверительных интервалов используется Лемма (Теорема) Фишера:

 

Пусть Х1, Х2,…..Хn — независимая выборка из генеральной совокупности с нормальным законом распределения. Пусть — выборочное среднее, а — несмещённая выборочная дисперсия. Тогда

 

1. и независимы

 

Замечание 24.17. Часто приходится слышать, что «независимые величины – это величины, не имеющие ничего общего». Это убедительный контрпример для подобного заблуждения: выборочное среднее и дисперсия не просто «имеют что-то общее», а вторая выражается через первое.

 

2. имеет стандартное нормальное распределение . Позволяет оценить неизвестное математическое ожидание a при известной дисперсии и наоборот, неизвестную дисперсию σ по известному математическому ожиданию a.

 

Случай, аналогичный предыдущему. Подобрав по заданному α такое d, что P(| a| < d) = α, получим = α

 

Задача. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной 6,25. Произведена выборка объема n = 27 и получено средневыборочное значение характеристики = 12. Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с доверительной вероятностью
α =0,99.

Решение. Сначала по таблице для функции Лапласа найдем значение t из равенства F (t) = α / 2 = 0,495. По полученному значению
t = 2,58 определим точность оценки (или половину длины доверительного интервала) d: d=s t / = 2,5´2,58 / » 1,24. Отсюда получаем искомый доверительный интервал: (10,76; 13,24).

 

 

3. то есть имеет распределение «хи-квадрат» с n-1 степенью свободы. Позволяет оценить неизвестную дисперсию при неизвестном математическом ожидании

 

Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях — случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с доверительной вероятностью 98%.

Решение. По числу степеней свободы, равному 19, и по вероятности (1 – 0,98)/2 = 0,01 находим из таблицы распределения c2величину
c22 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем c12 = 7,63. Используя формулу для доверительного интервала, получаем искомый доверительный интервал: (3,44; 7,49).

 

4. ~ tn-1 , то есть имеет распределение Стьюдента с n-1 степенью свободы. Позволяет оценить неизвестное математическое ожидание при неизвестной дисперсии. (s – выборочная дисперсия), используя свойство функции распределения закона Стьюдента t(-x) = 1 – t(x)

 

Задача. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении (рассчитанном как корень квадратный из исправленной выборочной дисперсии), равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с доверительной вероятностью 0,95 доверительный интервал для математического ожидания этой случайной величины.

Решение. Величина 1 – α в данном случае равна 0,05. По таблице распределения Стьюдента, при числе степеней свободы, равном 19, находим: tα = 2,093. Вычислим теперь точность оценки: 2,093´121/ = 56,6. Отсюда получаем искомый доверительный интервал:

(1943,4; 2056,6).

 

 








Дата добавления: 2017-06-02; просмотров: 1324;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.024 сек.