Интервальные оценки
Любая точечная оценка является функцией выборки, то есть является случайной величиной, а при каждой реализации выборки эта функция определяет единственное значение оценки, принимаемое за приближаемое значение оцениваемой характеристики.
При этом надо принимать во внимание, что в каждом конкретном случае значение оценки может отличаться от значения параметра, поэтому желательно было бы знать и возможную погрешность, возникающую при использовании предлагаемой оценки, например, указывая такой интервал (или область в случае векторного (неодномерного) параметра), внутри которого с высокой (т. е. близкой к 1) вероятностью находится истинное значение оцениваемого параметра. При таком подходе говорят об интервальном или доверительном оценивании. Основная цель при
этом состоит в том, чтобы при заданном доверительном уровне, построить
кратчайший интервал, обеспечивающий наиболее точную локализацию оцениваемой характеристики.
То есть, в некоторых случаях оказывается более важным установить не конкретное число – кандидата на значение неизвестного параметра (точечное оценивание), а указать интервал, в котором с некоторой вероятностью находится искомое неизвестное значение параметра.
Границы этого интервала, называемого доверительным, строятся по выборке, то есть являются оценками (интервальными) данного параметра.
Итак, мы хотим найти такие статистики * (Х1… ,Хn (верхняя доверительная граница) и * (Х1… ,Хn ) (нижняя доверительная граница), чтобы с вероятностью α выполнялось равенство
P * (Х1… ,Хn ) ≤ θ ≤ * (Х1… ,Хn ) = α, то есть с заданной вероятностью значение параметра попадало бы в полученный интервал.
Замечание 24.12. Α в разных источниках называется коэффициентом доверия, уровнем доверия, доверительной вероятностью, надежностью.
Замечание 24.13. Иногда задача формулируется немного по-другому: требуют выполнения с вероятностью α неравенства
P ( * (Х1… ,Хn ) ≤ θ ≤ * (Х1… ,Хn )≥ α, то есть вероятность попасть в интервал для параметра должна быть не меньше α
Сначала задается доверительная вероятность. Обычно ее выбирают равной 0.95, 0.99 или 0.999. Тогда вероятность того, что интересующий нас параметр попал в интервал ( *, *) достаточно высока. Число ( *+ *)/ 2 – середина доверительного интервала – будет давать значение параметра θ с точностью ( * - *)/ 2, которая представляет собой половину длины доверительного интервала.
Таким образом, границы доверительного интервала будут зависеть не только от самих наблюдений, но и от их числа n и заданной доверительной вероятности α.
Определение 24.11
Таким образом, доверительным (для оценки параметра θ, отвечающим доверительной вероятности α) называется такой интервал, который с наперед заданной вероятностью содержит оцениваемый параметр. Границы его θ* и θ* будут зависеть от α и от числа наблюдений n
Замечание 24.14. Как и в случае точечных оценок, получаемые оценки (границы интервала) тем ближе к параметру с тем большей вероятностью, чем больше объем выборки (Напомним, что все характеристики качества оценок рассматриваются при n→∞)
Пример 24.9. Пусть θ – среднее значение предела прочности некоторого материала, которое оценивают независимо друг от друга в каждой из N различных лабораторий по результатам n независимых испытаний. Иначе говоря, среднее значение предела прочности в каждой лаборатории оценивают по собственным экспериментальным данным, представленным выборкой объема n, и в каждой лаборатории получают свои значения верхней и нижней границ α-доверительного интервала
Возможны случаи, когда α-доверительный интервал для параметра θ не накрывает его истинного значения. Если М – число таких случаев, то при больших значениях N должно выполняться приближенное равенство α =(N – M)/N. Таким образом, если опыт – получение выборки объема n в лаборатории, то уровень доверия α – доля тех опытов ( при их многократном независимом повторении), в каждом из которых α-доверительный интервал накрывает истинное значение оцениваемого параметра.
Напоминание. Оценка (Х1… ,Хn ) называется асимптотически нормальной с дисперсией Δ2, если
( – q ) сходится при n →∞ по распределению к стандартному нормальному закону (нормальное распределение при нулевом математическом ожидании и дисперсии, равной 1)
Асимптотически нормальными являются выборочное среднее, дисперсия, моменты
Замечание 24.15.
Построение доверительного интервала основано на определении функции распределения и ее важнейшем свойстве функции распределения: вероятность того, что случайная величина примет значение из промежутка (х1; х2) равна приращению функции распределения на этом промежутке. P(x1 £Х < x2) = F(x2) – F(x1)
Кроме того напомним, что FХ (α) = P(Х < α). В частности, если некоторая величина имеет стандартное нормальное распределение с функцией распределения N(x), P(x1 £Х < x2) = N(x2) – N(x1) и NХ (α) = P(Х < α), где
, а - функция Лапласа
1. Доверительные интервалы для неизвестного математического ожидания m=E(X) при известной дисперсии σ2= DX
Согласно свойству асимптотической нормальности выборочного среднего имеем , то есть приблизительно равна функции распределения нормального закона.
Тогда для любого z>0
эквивалентно где функция распределения нормального закона
выражается через функцию Лапласа
Получим ввиду нечетности функции Лапласа
Поскольку, как уже говорилось (Лекция 19) для функции Лапласа существуют таблицы, можно взять в качестве z zα – ее квантиль порядка α .
2. Доверительные интервалы для неизвестного математического ожидания m=E(X) при неизвестной дисперсии σ2= DX
Проведя аналогичные рассуждения, можно воспользоваться последней формулой, взяв в качестве σ корень из выборочной дисперсии , где
Тогда мы получим аналогичное приближение
и аналогичный интервал
Замечание 24.16
В построениях мы использовали свойство асимптотической нормальности, то есть допущение n→∞. На практике это означает требование большого размера выборки.
Если мы будем рассматривать исходную случайную величину с нормальным законом распределения, тогда можно построить доверительный интервал с вероятностью, ровно равной α, поскольку тут нет необходимости в асимптотических формулах и имеет место «удобное» нормальное распределение. Соответственно, n может быть относительно небольшим.
положим
В случае, если рассматривается выборка из нормального закона, для построения доверительных интервалов используется Лемма (Теорема) Фишера:
Пусть Х1, Х2,…..Хn — независимая выборка из генеральной совокупности с нормальным законом распределения. Пусть — выборочное среднее, а — несмещённая выборочная дисперсия. Тогда
1. и независимы
Замечание 24.17. Часто приходится слышать, что «независимые величины – это величины, не имеющие ничего общего». Это убедительный контрпример для подобного заблуждения: выборочное среднее и дисперсия не просто «имеют что-то общее», а вторая выражается через первое.
2. имеет стандартное нормальное распределение . Позволяет оценить неизвестное математическое ожидание a при известной дисперсии и наоборот, неизвестную дисперсию σ по известному математическому ожиданию a.
Случай, аналогичный предыдущему. Подобрав по заданному α такое d, что P(| – a| < d) = α, получим = α
Задача. Пусть имеется генеральная совокупность с некоторой характеристикой, распределенной по нормальному закону с дисперсией, равной 6,25. Произведена выборка объема n = 27 и получено средневыборочное значение характеристики = 12. Найти доверительный интервал, покрывающий неизвестное математическое ожидание исследуемой характеристики генеральной совокупности с доверительной вероятностью
α =0,99.
Решение. Сначала по таблице для функции Лапласа найдем значение t из равенства F (t) = α / 2 = 0,495. По полученному значению
t = 2,58 определим точность оценки (или половину длины доверительного интервала) d: d=s t / = 2,5´2,58 / » 1,24. Отсюда получаем искомый доверительный интервал: (10,76; 13,24).
3. то есть имеет распределение «хи-квадрат» с n-1 степенью свободы. Позволяет оценить неизвестную дисперсию при неизвестном математическом ожидании
Задача. Будем считать, что шум в кабинах вертолетов одного и того же типа при работающих в определенном режиме двигателях — случайная величина, распределенная по нормальному закону. Было случайным образом выбрано 20 вертолетов, и произведены замеры уровня шума (в децибелах) в каждом из них. Исправленная выборочная дисперсия измерений оказалась равной 22,5. Найти доверительный интервал, накрывающий неизвестное стандартное отклонение величины шума в кабинах вертолетов данного типа с доверительной вероятностью 98%.
Решение. По числу степеней свободы, равному 19, и по вероятности (1 – 0,98)/2 = 0,01 находим из таблицы распределения c2величину
c22 = 36,2. Аналогичным образом при вероятности (1 + 0,98)/2 = 0,99 получаем c12 = 7,63. Используя формулу для доверительного интервала, получаем искомый доверительный интервал: (3,44; 7,49).
4. ~ tn-1 , то есть имеет распределение Стьюдента с n-1 степенью свободы. Позволяет оценить неизвестное математическое ожидание при неизвестной дисперсии. (s – выборочная дисперсия), используя свойство функции распределения закона Стьюдента t(-x) = 1 – t(x)
Задача. На контрольных испытаниях 20-ти электроламп средняя продолжительность их работы оказалась равной 2000 часов при среднем квадратическом отклонении (рассчитанном как корень квадратный из исправленной выборочной дисперсии), равном 11-ти часам. Известно, что продолжительность работы лампы является нормально распределенной случайной величиной. Определить с доверительной вероятностью 0,95 доверительный интервал для математического ожидания этой случайной величины.
Решение. Величина 1 – α в данном случае равна 0,05. По таблице распределения Стьюдента, при числе степеней свободы, равном 19, находим: tα = 2,093. Вычислим теперь точность оценки: 2,093´121/ = 56,6. Отсюда получаем искомый доверительный интервал:
(1943,4; 2056,6).
Дата добавления: 2017-06-02; просмотров: 1324;