Ошибки выборки
При правильном формировании выборки величину ее ошибки можно рассчитать заранее. В общем случае под ошибкой выборкипонимают объективно возникающее расхождение между характеристиками выборки и генеральной совокупности.
Ошибки выборкиподразделяются на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрациивозникают из-за неправильных или неточных сведений. Их источником является невнимательность регистратора, неправильное заполнение формуляров, описки или же непонимание существа исследуемого вопроса.
Ошибки репрезентативностивозникают вследствие несоответствия структуры выборки структуре генеральной совокупности. Источником их существования является разная вариация признака у статистических единиц, в результате которой распределение единиц в выборочной совокупности отличается от распределения единиц в генеральной совокупности.
Ошибки репрезентативности делятся на систематические и случайные.
Систематические ошибкирепрезентативности возникают из-за неправильного формирования выборки, при котором нарушается основной принцип научно организованной выборки – принцип случайности.
Случайные ошибкирепрезентативности означают, что даже при соблюдении принципа случайности отбора единиц, расхождения между характеристиками выборки и генеральной совокупности все же имеют место.
Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. Для среднего значения ошибка будет определяться так:
, где (6.1)
хi – вариант (значение варьирующего признака)
fi – частота, вес
N – объем генеральной совокупности ( = сумме fi)
(6.2)
хi – вариант (значение варьирующего признака)
ti – частота, вес
n – объем выборочной совокупности
Рассмотрим пример: Даны две 10-ти процентные выборки успеваемости студентов (табл. 6.1).
Таблица 6.1 – Исходные данные
Оценка | Число студентов | ||
Генеральная совокупность | 1-я выборка | 2-я выборка | |
Итого: |
Рассчитаем ошибку выборки.
1. Средний балл рассчитываем по средней арифметической взвешенной:
По генеральной совокупности:
а) =
По выборочным совокупностям:
б) =
в) = 3,54
Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности:
= 3,58 - 3,65 = -0,07
= 3,58 - 3,54 = +0,04
Величина ошибки выборки зависит от следующих факторов:
- Степени колеблемости признака в генеральной совокупности
Чем однороднее исследуемая совокупность, тем меньше величина средней ошибки при той же самой численности выборки.
- Объема (численности) выборки
Увеличивая или уменьшая объем выборки n, можно регулировать величину средней ошибки. Чем больше единиц будет включено в выборку, тем меньше будет величина ошибки, так как тем точнее в выборке будет представлена генеральная совокупность.
- Способа отбора единиц в выборочную совокупность
Для каждого способа формирования выборки величина ее ошибки определяется по разному. В практической деятельности используются различные способы формирования выборочной совокупности, но принципиальное значение имеет их деление на способы случайного (повторного и бесповторного) отбора.
При собственно случайном повторном отбореобщее число единиц генеральной совокупности в процессе выборке не меняется.
Статистическая единица, попавшая в выборку, после регистрации изучаемого признака возвращается в генеральную совокупность и можетвновь попасть в выборку. Таким образом, для всех единиц генеральнойсовокупности обеспечивается равная вероятность отбора.
В математической статистике доказывается, что средняя ошибка выборки определяется по формуле: (6.3)
где - дисперсия генеральной совокупности;
n – объем выборочной совокупности.
Дисперсия – отклонение признака от средней величины. Генеральная дисперсия, также как и остальные параметры генеральной совокупности, является неизвестной величиной, но известно соотношение между генеральной и выборочной дисперсией: ~ , тогда при достаточно большом объеме выборки (n>30), является величиной близкой к 1, и можно считать, что ~ . В случаях малой выборки при n<30 необходимо учитывать отношение .
На практике показатель дисперсии по генеральной совокупности заменяют на аналогичный показатель по выборочной совокупности на базе закона больших чисел. По этому закону выборочная совокупность при достаточно большом ее объеме точно воспроизводит характеристики генеральной совокупности.
Следовательно, , (6.4)
где - выборочная дисперсия количественного признака, .
n – объем выборочной совокупности.
Средняя ошибка выборки для доли определяется по формуле: (6.5)
где - выборочная дисперсия доли альтернативного признака,
Применение простой случайной повторной выборки на практике весьма ограниченно. Это связано с тем, что практически нецелесообразно, а иногда и невозможно повторное наблюдение одних и тех же единиц, и поэтому однажды обследованная единица повторному учету не подвергается. Поэтому чаще на практике применяется бесповторный отбор.
При бесповторном собственно случайном отбореобщее количество статистических единиц в генеральной совокупности в процессе формирования выборки меняется, уменьшаясь каждый раз на единицу, попавшую в выборку, поскольку отобранные единицы в генеральную совокупность не возвращаются. Таким образом, вероятность попадания отдельных единиц в выборку при бесповторном случайном отборе также меняется (для оставшихся единиц она возрастает). В целом вероятность попадания любой статистической единицы в выборку при бесповторном отборе может быть определена как . На эту величину должна быть скорректирована и средняя ошибка выборки при бесповторном отборе.
Таким образом, расчетные формулы средней ошибки выборки при бесповторном отборе принимают вид:
• для среднейколичественного признака (6.6)
• для долиальтернативного признака (6.7)
На практике при применении выборочного метода определяются пределы, за которые не выйдет величина конкретной ошибки выборочногоисследования. Величина пределов конкретной ошибки определяетсястепенью вероятности, с которой измеряется ошибка выборки.
Ошибка выборки, исчисленная с заданной степенью вероятности, называется предельной ошибкой выборки.
Предельная ошибка выборки является максимально возможной при данной вероятности ошибкой. Это означает, что с заданной вероятностью гарантируется, что ошибка любой выборки не превысит предельную ошибку. Такая вероятность называется доверительной.
Предельная ошибка выборкирассчитывается по формуле:
,
где t – коэффициент доверия, значения которого определяются доверительной вероятностью F(t) .
Значения коэффициента доверия t задаются в таблицах нормального распределения вероятностей. Чаще всего используются следующие сочетания:
t | F(t) |
0,683 | |
1,5 | 0,866 |
0,954 | |
2,5 | 0,988 |
0,997 | |
3,5 | 0,999 |
Так, если t = 1, то с вероятностью 0,683 можно утверждать, что расхождение между выборочными характеристиками и параметрами генеральной совокупности не превысит одной средней ошибки.
Предельные ошибки выборкидля разных параметров при разных методах отбора статистических единиц рассчитываются по формулам, приведенным в таблице 6.2.
Таблица 6.2 – Формулы расчета предельных ошибок выборки при собственно-случайном отборе единиц выборочной совокупности
Метод отбора | Предельные ошибки выборки | |
Для средней характеристики | Для доли | |
Повторный | ||
Бесповторный |
Зная величину предельной ошибки выборки, можно рассчитать интервалы, в которых будут находиться характеристики генеральной совокупности:
(6.8)
Пределы, в которых с данной степенью вероятности будет заключена неизвестная величина изучаемого показателя в генеральной совокупности, называют доверительными интервалами, а вероятность F(t) – доверительной вероятностью. Чем выше значение ошибки выборки , тем больше величина доверительного интервала и, следовательно, ниже точность оценки.
Рассмотрим нахождение средних и предельных ошибок выборок, определение доверительных интервалов для средней и доли на следующем примере:
Пример: При оценке спроса на товар А было проведено пятипроцентное бесповторное обследование регионального рынка. При этом было выяснено, что в 90 из 100 обследованных семей данный товар потребляется. В среднем каждая из обследованных семей потребляла 5 единиц товара ( = 5) при стандартном отклонении 0,5 единицы ( =0,5 ед.).
С вероятностью p = 0,954 необходимо установить долю семей, потребляющих данный товар и среднее его потребление (спрос).
Для получения статистических оценок параметров генеральной совокупности выполним следующие процедуры:
1.Определим характеристики выборочной совокупности:
- выборочную долю (удельный вес семей в выборке, потребляющих товар А):
- выборочную среднюю (средний объем потребления товара А одной семьей в выборке): = 5 единиц.
2.Определим предельные ошибки выборки:
для доли
где
для средней
3. Рассчитаем доверительные интервалы характеристик генеральной совокупности:
для доли :
0,9-0,059 ≤ P ≤ 0,9+0,059,
0,841≤ P ≤ 0,959;
для средней :
5-0,1≤ ≤5+0,1,
4,9 ≤ ≤5,1.
Таким образом, с вероятностью 0,954 можно утверждать, что доля семей потребляющих данный товар не меньше 84,1%, но не более 95,9%, а среднее потребление товара в семьях находится в пределах от 4,9 до 5,1 единиц. На основании проведенных расчетов можно определить границы потребления (спроса) товара А на данном рынке:
Таким образом, с вероятностью в 95% можно утверждать, что спрос на товар А не будет ниже 8240 единиц, но и не превысит 9780 единиц.
Дата добавления: 2015-02-25; просмотров: 1966;