Оценки для математического ожидания и дисперсии
Пусть имеется случайная величина Х с математическим ожиданием m и дисперсией D, оба параметра неизвестны. Над величиной Х произведено n независимых опытов, давших результаты X1, Х2, …, Xn. Требуется найти состоятельные и несмещенные оценки для параметров m и D.
В качестве оценки для математического ожидания естественно предложить среднее арифметическое наблюденных значений
n
m =m* = Σi=1Xi
n
Нетрудно убедиться, что эта оценка является состоятельная: согласно закону больших чисел, при увеличении n величина m˜ сходится по вероятности к m. Оценка m˜ является также и несмещенной, так как
n
M[m˜]= Σi=1m =m
. n
Дисперсия этой оценки равна
D[m˜] =1/n D
Эффективность или неэффективность оценки зависит от вида закона распределения величины X. Можно доказать, что если величина Х распределена по нормальному закону, дисперсия будет минимально возможной, т. е. оценка m˜ является эффективной. Для других законов распределения это может быть и не так.
Перейдем к оценке для дисперсии D. На первый взгляд наиболее естественной оценкой представляется статистическая дисперсия:
n
D*= Σ (xi-m˜)2
i=1
n
где m˜ = Σni=1Xi
n
Эта оценка состоятельна.
Для того, чтобы оценка D* была также и несмещенной берут, так называемую «исправленную статистическую дисперсию»
n
D˜= Σ (xi-m˜)2
i=1
n-1
Данная оценка является и состоятельной.
Можно принять следующие правила обработки ограниченного по объему статистического материала.
Если даны значения х1, х2, .... хn, полученные в n независимых опытах случайной величиной Х с неизвестными математическим ожиданием m и дисперсией D, то для определения этих параметров следует пользоваться приближенными значениями (оценками):
n
m˜ = Σi=1Xi
n
n
D˜= Σ (xi-m˜)2
i=1
n-1
Доверительный интервал. Доверительная вероятность.
Мы рассмотрели вопрос об оценке неизвестного параметра а одним числом. Такая оценка называется «точечной». В ряде задач требуется не только найти для параметра а подходящее численное значение, но и оценить его точность и надежность. Требуется знать - к каким ошибкам может привести замена параметра а его точечной оценкой а˜ и с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы? Такого рода задачи особенно актуальны при малом числе наблюдений, когда точечная оценка а в значительной мере случайна и приближенная замена а на а˜ может привести к серьезным ошибкам. Чтобы дать представление о точности и надежности оценки а, в математической статистике пользуются так называемыми доверительными интервалами и доверительными вероятностями.
Пусть для параметра а получена из опыта несмещенная оценка а˜. Требуется оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность β (например, р=0,9, 0,95 или 0,99) такую, что событие с вероятностью β можно считать практически достоверным, и найдем такое значение ε, для которого
Р(│а˜-а│< ε) = β
Тогда диапазон практически возможных значений ошибки, возникающей при замене а на а˜, будет ± ε; большие по абсолютной величине ошибки будут появляться только с малой вероятностью α= 1-β. Перепишем в виде:
Р(а˜ - ε) <а<а˜+ ε) = β
Это равенство означает, что с вероятностью β неизвестное значение параметра а попадает в интервал
I β =( а˜ - ε; а˜+ ε )
При этом необходимо отметить одно обстоятельство. Ранее мы неоднократно рассматривали вероятность попадания случайной величины в заданный неслучайный интервал. Здесь дело обстоит иначе: величина а не случайна, зато случаен интервал I β. Случайно его положение на оси абсцисс, определяемое его центром а; случайна вообще и длина интервала 2ε, так как величина е вычисляется, как правило, по опытным данным. Поэтому в данном случае лучше будет толковать величину р не как вероятность «попадания» точки а в интервал I β, а как вероятность того, что случайный интервал I β накроет точку а.
0 а
Вероятность β принято называть доверительной вероятностью, а интервал I β - доверительным интервалом. Границы интервала I β
а1 = а˜ - ε; а2 = а˜+ ε называются доверительными границами.
Дадим еще одно истолкование понятию доверительного интервала: его можно рассматривать как интервал значений параметра а, совместимых с опытными данными и не противоречащих им. Действительно, если условиться считать событие с вероятностью а=1-β практически невозможным, то те значения параметра а, для которых │а˜-а│ > ε, нужно признать противоречащими опытным данным, а те, для которых │а˜-а│< ε, - совместимыми с ними. Перейдем к вопросу о нахождении доверительных границ а1 и a2. Пусть для параметра а имеется несмещенная оценка а˜. Если бы нам был известен закон распределения величины а, задача нахождения доверительного интервала была бы весьма проста: достаточно было бы найти такое значение ε, для которого
Р(│а˜ -а│<ε) = β
Дата добавления: 2016-02-20; просмотров: 918;