ДОВЕРИТЕЛЬНЫЕ ИНТЕРВАЛЫ И ДОВЕРИТЕЛЬНЫЕ ВЕРОЯТНОСТИ

Теоремы 1 и 2 хотя и являются общими, т. е. сформулированы при достаточно широких предположениях, они не дают возможности установить, насколько близки оценки к оцениваемым параметрам. Из факта, что —оценки являются состоятельными, следует только то, что при увеличении объема выборки значение P(|θ* – θ| < δ), δ < 0, приближается к 1.

Возникают следующие вопросы.

1) Каким должен быть объем выборки п, чтобы заданная точность
|θ* – θ| = δ была гарантирована с заранее принятой вероятностью?

2) Какова точность оценки, если объем выборки известен и вероятность безошибочности вывода задана?

3) Какова вероятность того, что при заданном объеме выборки будет обеспечена заданная точность оценки?

Введем несколько новых определений.

Определение. Вероятность γ выполнения неравенства, |θ*– θ| < δ называется доверительной вероятностью или надежностью оценки θ.

(1)

Перейдем от неравенства |θ*–θ| < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

(2)

Так как θ (оцениваемый параметр) – число постоянное, а θ* – величина случайная, понятие доверительной вероятности сформулировать так: доверительной вероятностью γ называется вероятность того, что интервал (θ*– δ, θ*+ δ) накрывает оцениваемый параметр.

Определение. Случайный интервал (θ*–δ, θ*+δ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр, называется доверительным интервалом İ, соответствующим коэффициенту доверия γ,

İ=(θ*– δ, θ*+ δ). (3)

Надежность оценки γ может задаваться заранее, тогда, зная закон распределения изучаемой случайной величины, можно найти доверительный интервал İ. Решается и обратная задача, когда по заданному İ находится соответствующая надежность оценки.

Пусть, например, γ = 0,95; тогда число р = 1 – у = 0,05 показывает, с какой вероятностью заключение о надежности оценки ошибочно. Число р=1–γ называется уровнем значимости. Уровень значимости задается заранее в зависимости от конкретного случая. Обычно р принимают равным 0,05; 0,01; 0,001.

Выясним, как построить доверительный интервал для математического ожидания нормально распределенного признака. Было показано, что

Оценим математическое ожидание с помощью выборочной средней учитывая, что также имеет нормальное распределение*. Имеем

(4)

а по формуле (12.9.2) получаем

Принимая во внимание (13.5.12), получим

(5)

Пусть известна вероятность γ. Тогда

Для удобства пользования таблицей функции Лапласа положим тогда а

(6)

Интервал

(7)

накрывает параметр а = М(Х)с вероятностью γ.

В большинстве случаев среднее квадратическое отклонение σ(Х) исследуемого признака неизвестно. Поэтому вместо σ(Х)при большой выборке (n > 30) применяют исправленное выборочное среднее квадратическое отклонение s, являющееся, в свою очередь оценкой σ(X), доверительный интервал будет иметь вид

İ =

Пример.С вероятностью γ = 0,95 найти доверительный интервал для М(Х)– длины колоса ячменя сорта «Московский 121». Распределение задается таблицей, в которой' вместо интервалов изменения (х_i, х_i _{+ 1}) взяты числа , см. Считать, что случайная величина X подчинена нормальному распределению.

	7,5	8,5	9,5	10,5	11,5	12,5	13,5
n_i

Решение. Выборка большая (n = 50). Имеем

Найдем точность оценки

Определим доверительные границы:

Таким образом, с надежностью γ = 0,95 математическое ожидание заключено в доверительном интервале I = (9,5; 10,3).

Итак, в случае большой выборки (n > 30), когда исправленное среднее квадратическое отклонение незначительно отклоняется от среднего квадратического отклонения значения признака в генеральной совокупности, можно найти доверительный интервал. Но делать большую выборку удается не всегда и это не всегда целесообразно. Из (7) видно, что чем меньше п, тем шире доверительный интервал, т. е. I зависит от объема выборки п.

Английский статистик Госсет (псевдоним Стьюдент) доказал, что в случае нормального распределения признака X в генеральной совокупности нормирования случайная величина

(8)

зависит только от объема выборки. Была найдена функция распределения случайной величины Т и вероятность P(T < t_γ), t_γ – точность оценки. Функция, определяемая равенством

s (n, t_γ) = P(|T| < t_γ) = γ (9)

названа t-распределением Стьюдента с п – 1 степенями свободы. Формула (9) связывает случайную величину Т, доверительный интервал İ и доверительную вероятность γ. Зная две из них, можно найти третью. Учитывая (8), имеем

(10)

Неравенство в левой части (13.7.10) заменим равносильным ему неравенством . В результате получим

или

(11)

где t_γ=t(γ,n). Для функции t_γ составлены таблицы (см. Приложение 5). При n>30 числа t_γ и t, найденные по таблице функции Лапласа, практически совпадают.

Доверительный интервал для оценки среднего квадратического отклонения σ_x в случае нормального распределения.

Теорема.Пусть известно, что случайная величина имеет нормальное распределение. Тогда для оценки параметра σ_х этого закона имеет место равенство

(12)

где γ – доверительная вероятность, зависящая от объема выборки п и точности оценки β.

Функция γ = Ψ (n, β) хорошо изучена. С ее помощью определяют β = β(γ,п). Для β = β(γ,п) составлены таблицы, по которым по известным п (объему выборки) и γ (доверительной вероятности) определяется β.

Пример.Для оценки параметра нормально распределенной случайной величины была сделана выборка (дневной удой 50 коров) и вычислено s = 1,5. Найти доверительный интервал, накрывающий с вероятностью γ = 0,95.

Решение. По таблице β(γ, п) для n = 50 и γ = 0,95 находим β = 0,21 (см. Приложение 6).

В соответствии с неравенством (13) найдем границы доверительного интервала. Имеем

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21·1,5 = 1,185;

1,185 < σ < 1,185.

Дата добавления: 2016-02-20; просмотров: 849;