Задачи выборочного метода
Выборочный метод позволяет решить две основные задачи, имеющие большое практическое значение. Первая задача заключается в установлении закона распределения изучаемой случайной величины и параметров этого распределения по данным выборки, вторая — в статистической проверке гипотез, выдвигаемых при различных производственных исследованиях.
Остановимся подробнее на первой задаче. На основании закона больших чисел можно утверждать, что если генеральная совокупность подчиняется определенному закону распределения, то и выборка из этой совокупности, если объем ее достаточно велик, будет подчиняться этому же закону. Утверждение будет тем точнее, чем больше объем выборки.
Всякую эмпирическую совокупность можно рассматривать как выборку большого объема из генеральной совокупности, подчиняющейся определенному теоретическому закону распределения. Следовательно, по характеру эмпирического распределения можно установить с определенной точностью и надежностью близкое ему теоретическое распределение. Зная закон, которому подчиняется данное распределение, можно использовать его для решения практических задач.
В ряде случаев тип закона можно установить заранее. Для этого необходимо проанализировать средствами теории вероятностей изучаемый процесс и подвести его, с некоторым приближением, к той или иной теоретической схеме. Например, основываясь на теореме Ляпунова, можно считать, что суммарная величина случайных погрешностей обработки при работе на настроенных станках при отсутствии действия какого-либо доминирующего фактора подчиняется закону нормального распределения. То же можно сказать о суммарной погрешности измерения, о средней высоте микронеровностей на обработанной поверхности и многих других технических величинах, подверженных колебаниям под действием большого количества случайных факторов.
В этих случаях, когда закон распределения заранее может быть установлен, задача сводится к нахождению неизвестных значений его параметров, т. е. к его параметризации. В случае нормального распределения задача сводится к установлению среднего арифметического значения изучаемой величины иеесреднего квадратического отклонения s0.
Оценка параметров распределения генеральной совокупности может быть практически осуществлена только на основании данных выборки из этой совокупности.
Беря выборку из генеральной совокупности и вычисляя ее статистические характеристики и s, можно с некоторым приближением считать, что они по своим величинам будут близки к соответствующим параметрам генеральной совокупности и s0, т. е. являться их оценками. Но для того чтобы эти оценки достаточно правильно и близко характеризовали параметры генеральной совокупности, необходимо, чтобы они удовлетворяли трем требованиям: были бы состоятельными, несмещенными и эффективными.
Оценка называется состоятельной, если вероятность отклонения ее от оцениваемого параметра на величину, меньшую как угодно малого положительного числа e, стремится к единице при неограниченном увеличении числа n наблюдений, т. е.
где Q — некоторый параметр генеральной совокупности;
Q' — оценка этого параметра.
Оценка называется несмещенной, т. е. в ней отсутствуют систематические погрешности, если математическое ожидание этой оценки равно оцениваемому параметру;
Если МQ' > 0, то оценку называют положительно смещенной; если MQ'<0, то отрицательно смещенной.
Примером состоятельной и несмещенной оценки математического ожидания является средняя арифметическая. Примером состоятельной, но смещенной оценки теоретической дисперсии s2 может служить эмпирическая дисперсия s2. Аналогичным образом при оценке величины s с помощью s мы получим состоятельную, но при малом п значительно смещенную оценку s. Так как
то с увеличением п вероятность ® 1 и, следовательно, s2 является состоятельной оценкой, но математическое ожидание не равно s2 и при конечном п дает преуменьшенное значение оцениваемого параметра s2, поэтому, оценивая s2 по s2, мы допускаем систематическую ошибку, равную , однако при больших п она пренебрежимо мала.
Для того чтобы получить несмещенную оценку теоретической дисперсии s2 по эмпирическим данным, необходимо эмпирическую
дисперсию s2 умножить на , т. е.
Практически эту поправку вносят при вычислении оценки дисперсии в тех случаях, когда п <30.
Состоятельных несмещенных оценок может быть несколько. Например, для оценки центра рассеивания нормального распределения, наряду со средней арифметической , может быть взята медиана Me. Медиана так же, как и , является несмещенной состоятельной оценкой центра группирования. Из двух состоятельных несмещенных оценок Q' и Q" для одного и того же параметра Q естественно отдать предпочтение той, у которой дисперсия меньше.
Такая оценка, у которой дисперсия будет наименьшей относительно Q, называется эффективной. Сравнительная эффективность Me при большой выборке приближенно равна
Практически это означает, что центр распределения генеральной совокупности о определяется по медиане Me с той же точностью при п наблюдениях, как при 0,6366 п наблюдениях по средней арифметической .
Дата добавления: 2015-10-05; просмотров: 1835;