Интервальные оценки

Любая точечная оценка является функцией выборки, то есть является случайной величиной, а при каждой реализации выборки эта функция определяет единственное значение оценки, принимаемое за приближаемое значение оцениваемой характеристики.

При этом надо принимать во внимание, что в каждом конкретном случае значение оценки может отличаться от значения параметра, поэтому желательно было бы знать и возможную погрешность, возникающую при использовании предлагаемой оценки, например, указывая такой интервал (или область в случае векторного (неодномерного) параметра), внутри которого с высокой (т. е. близкой к 1) вероятностью находится истинное значение оцениваемого параметра. При таком подходе говорят об интервальном или доверительном оценивании. Основная цель при

этом состоит в том, чтобы при заданном доверительном уровне, построить

кратчайший интервал, обеспечивающий наиболее точную локализацию оцениваемой характеристики.

То есть, в некоторых случаях оказывается более важным установить не конкретное число – кандидата на значение неизвестного параметра (точечное оценивание), а указать интервал, в котором с некоторой вероятностью находится искомое неизвестное значение параметра.

Границы этого интервала, называемого доверительным, строятся по выборке, то есть являются оценками (интервальными) данного параметра.

Итак, мы хотим найти такие статистики ^* (Х₁… ,Х_n (верхняя доверительная граница) и _* (Х₁… ,Х_n ) (нижняя доверительная граница), чтобы с вероятностью α выполнялось равенство

P _* (Х₁… ,Х_n ) ≤ θ ≤ ^* (Х₁… ,Х_n ) = α, то есть с заданной вероятностью значение параметра попадало бы в полученный интервал.

Замечание 24.12. Α в разных источниках называется коэффициентом доверия, уровнем доверия, доверительной вероятностью, надежностью.

Замечание 24.13. Иногда задача формулируется немного по-другому: требуют выполнения с вероятностью α неравенства

P ( _* (Х₁… ,Х_n ) ≤ θ ≤ ^* (Х₁… ,Х_n )≥ α, то есть вероятность попасть в интервал для параметра должна быть не меньше α

Сначала задается доверительная вероятность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал ( _*, ^*) достаточно высока. Число ( _*+ ^*)/ 2 – середина доверительного интервала – будет давать значение параметра θ с точностью ( _* - ^*)/ 2, которая представляет собой половину длины доверительного интервала.

Таким образом, границы доверительного интервала будут зависеть не только от самих наблюдений, но и от их числа n и заданной доверительной вероятности α.

Определение 24.11

Таким образом, доверительным (для оценки параметра θ, отвечающим доверительной вероятности α) называется такой интервал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы его θ_* и θ^* будут зависеть от α и от числа наблюдений n

Замечание 24.14. Как и в случае точечных оценок, получаемые оценки (границы интервала) тем ближе к параметру с тем большей вероятностью, чем больше объем выборки (Напомним, что все характеристики качества оценок рассматриваются при n→∞)

Пример 24.9. Пусть θ – среднее значение предела прочности некоторого материала, которое оценивают независимо друг от друга в каждой из N различных лабораторий по результатам n независимых испытаний. Иначе говоря, среднее значение предела прочности в каждой лаборатории оценивают по собственным экспериментальным данным, представленным выборкой объема n, и в каждой лаборатории получают свои значения верхней и нижней границ α-доверительного интервала

Возможны случаи, когда α-доверительный интервал для параметра θ не накрывает его истинного значения. Если М – число таких случаев, то при больших значениях N должно выполняться приближенное равенство α =(N – M)/N. Таким образом, если опыт – получение выборки объема n в лаборатории, то уровень доверия α – доля тех опытов ( при их многократном независимом повторении), в каждом из которых α-доверительный интервал накрывает истинное значение оцениваемого параметра.

Напоминание. Оценка (Х₁… ,Х_n ) называется асимптотически нормальной с дисперсией Δ², если

( – q ) сходится при n →∞ по распределению к стандартному нормальному закону (нормальное распределение при нулевом математическом ожидании и дисперсии, равной 1)

Асимптотически нормальными являются выборочное среднее, дисперсия, моменты

Замечание 24.15.

Построение доверительного интервала основано на определении функции распределения и ее важнейшем свойстве функции распределения: вероятность того, что случайная величина примет значение из промежутка (х₁; х₂) равна приращению функции распределения на этом промежутке. P(x₁£Х < x₂) = F(x₂) – F(x₁)

Кроме того напомним, что F_Х(α) = P(Х < α). В частности, если некоторая величина имеет стандартное нормальное распределение с функцией распределения N(x), P(x₁£Х < x₂) = N(x₂) – N(x₁) и N_Х(α) = P(Х < α), где

, а - функция Лапласа

1. Доверительные интервалы для неизвестного математического ожидания m=E(X) при известной дисперсии σ²= DX

Согласно свойству асимптотической нормальности выборочного среднего имеем , то есть приблизительно равна функции распределения нормального закона.

Тогда для любого z>0

эквивалентно где функция распределения нормального закона

выражается через функцию Лапласа

Получим ввиду нечетности функции Лапласа

Поскольку, как уже говорилось (Лекция 19) для функции Лапласа существуют таблицы, можно взять в качестве z z_α – ее квантиль порядка α .

2. Доверительные интервалы для неизвестного математического ожидания m=E(X) при неизвестной дисперсии σ²= DX

Проведя аналогичные рассуждения, можно воспользоваться последней формулой, взяв в качестве σ корень из выборочной дисперсии , где

Тогда мы получим аналогичное приближение

и аналогичный интервал

Замечание 24.16

В построениях мы использовали свойство асимптотической нормальности, то есть допущение n→∞. На практике это означает требование большого размера выборки.

Если мы будем рассматривать исходную случайную величину с нормальным законом распределения, тогда можно построить доверительный интервал с вероятностью, ровно равной α, поскольку тут нет необходимости в асимптотических формулах и имеет место «удобное» нормальное распределение. Соответственно, n может быть относительно небольшим.

положим

В случае, если рассматривается выборка из нормального закона, для построения доверительных интервалов используется Лемма (Теорема) Фишера:

Пусть Х₁, Х₂,…..Х_n — независимая выборка из генеральной совокупности с нормальным законом распределения. Пусть — выборочное среднее, а — несмещённая выборочная дисперсия. Тогда

1. и независимы

Замечание 24.17. Часто приходится слышать, что «независимые величины – это величины, не имеющие ничего общего». Это убедительный контрпример для подобного заблуждения: выборочное среднее и дисперсия не просто «имеют что-то общее», а вторая выражается через первое.

2. имеет стандартное нормальное распределение . Позволяет оценить неизвестное математическое ожидание a при известной дисперсии и наоборот, неизвестную дисперсию σ по известному математическому ожиданию a.

Случай, аналогичный предыдущему. Подобрав по заданному α такое d, что P(| – a| < d) = α, получим = α

Задача. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной 6,25. Произведена выборка объема n = 27 и получено средневыборочное значение характеристики = 12. Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с доверительной вероятностью
α =0,99.

Решение. Сначала по таблице для функции Лапласа найдем значение t из равенства F (t) = α / 2 = 0,495. По полученному значению
t = 2,58 определим точность оценки (или половину длины доверительного интервала) d: d=s t / = 2,5´2,58 / » 1,24. Отсюда получаем искомый доверительный интервал: (10,76; 13,24).

3. то есть имеет распределение «хи-квадрат» с n-1 степенью свободы. Позволяет оценить неизвестную дисперсию при неизвестном математическом ожидании

Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях — случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с доверительной вероятностью 98%.

Решение. По числу степеней свободы, равному 19, и по вероятности (1 – 0,98)/2 = 0,01 находим из таблицы распределения c²величину
c₂² = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем c₁² = 7,63. Используя формулу для доверительного интервала, получаем искомый доверительный интервал: (3,44; 7,49).

4. ~ t_n_-1 , то есть имеет распределение Стьюдента с n-1 степенью свободы. Позволяет оценить неизвестное математическое ожидание при неизвестной дисперсии. (s – выборочная дисперсия), используя свойство функции распределения закона Стьюдента t(-x) = 1 – t(x)

Задача. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении (рассчитанном как корень квадратный из исправленной выборочной дисперсии), равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с доверительной вероятностью 0,95 доверительный интервал для математического ожидания этой случайной величины.

Решение. Величина 1 – α в данном случае равна 0,05. По таблице распределения Стьюдента, при числе степеней свободы, равном 19, находим: t_α = 2,093. Вычислим теперь точность оценки: 2,093´121/ = 56,6. Отсюда получаем искомый доверительный интервал:

(1943,4; 2056,6).

123 4

Дата добавления: 2017-06-02; просмотров: 1424;