Понятие о выборочном наблюдении
Наиболее совершенным и научно обоснованным способом несплошного наблюдения является выборочное наблюдение, получившее в настоящее время широкое применение в работе органов государственной статистики, научно-исследовательских лабораторий, институтов, предприятий. Его использование позволяет лучше организовать наблюдение, обеспечивает быстроту проведения, экономию труда и средств на получение и обработку информации.
Выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить о всей совокупности. Однако вычисленные по материалам выборочного наблюдения статистические показатели не будут точно совпадать с соответствующими характеристиками для всей совокупности (генеральной совокупности). Величина этих отклонений называется ошибкой наблюдения, которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.
Ошибки регистрации свойственны любому наблюдению (сплошному и несплошному). Они вызываются несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, неточностью подсчетов и т. п. Однако при выборочном наблюдении они значительно меньше, так как в этом случае используются более квалифицированные и подготовленные кадры.
Ошибки репрезентативности свойственны только несплошным наблюдениям. Они характеризуют размер расхождений между величинами показателя, полученного в выборочной и генеральной совокупности в условиях одинаковой точности единичных наблюдений. Ошибки репрезентативности могут быть систематическими и случайными. Систематические ошибки возникают при нарушении установленных правил отбора единиц. Случайные ошибки репрезентативности обязаны своим возникновением недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.
Величина случайной ошибки определяет надежность данных выборочного наблюдения, их пригодность для суждения о генеральной совокупности. При помощи формул теории вероятностей можно рассчитать возможную максимальную случайную ошибку - вероятный (стохастический) предел ошибки.
Максимально возможная ошибка — это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.
Величина случайной ошибки репрезентативности зависит от:
• степени колеблемости изучаемого признака в генеральной
совокупности;
• способа формирования выборочной совокупности;
• объема выборки.
По степени охвата единиц исследуемой совокупности различают большие и малые выборки.
По способу формирования выборочной совокупности различают следующие виды выборочного наблюдения: простая случайная (собственно случайная) выборка, расслоенная (типическая или районированная), серийная, механическая, комбинированная, ступенчатая, многофазная.
Совокупность единиц, из которых производится отбор, принято называть генеральной совокупностью. Совокупность отобранных единиц из генеральной совокупности называется выборочной совокупностью.
N - объем генеральной совокупности (число входящих в нее единиц);
n — объем выборочной совокупности (число единиц, попавших в выборку);
- генеральная средняя (среднее значение признака в генеральной совокупности);
- выборочная средняя (среднее значение признака в выборочной совокупности);
р - генеральная доля (доля единиц, обладающих данным признаком в генеральной совокупности);
w - выборочная доля (доля единиц, обладающих данным признаком в выборочной совокупности);
— генеральная дисперсия (дисперсия признака в генеральной совокупности);
S2 - выборочная дисперсия (дисперсия признака в выборочной совокупности);
- среднее квадратическое отклонение признака в генеральной совокупности;
S — среднее квадратическое отклонение признака в выборочной совокупности.
Простая случайная выборка
При простой случайной выборке отбор единиц в выборочную совокупность производится непосредственно из всей массы единиц генеральной совокупности в форме случайного отбора, при котором каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения. Случайный отбор осуществляется путем применения жеребьевки (лотереи) или путем использования таблиц случайных чисел.
Случайный отбор может быть проведен в двух формах: в форме возвратной (повторной) выборки и в форме безвозвратной (бесповторной) выборки. При повторном отборе вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной. При бесповторном отборе выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).
Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка.
Теорема П. Л. Чебышева утверждает принципиальную возможность определения генеральной средней по данным случайной повторной выборки. Теорема Чебышева дополняется теоремой А. М. Ляпунова, которая позволяет рассчитать максимальную ошибку выборочной средней при данном достаточно большом числе независимых наблюдений. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что расхождение между выборочной и генеральной средней ( ) не превзойдет по абсолютной величине некоторую величину , равна интегралу Лапласа. Это можно записать так:
;
,
где - интеграл Лапласа (нормированная функция Лапласа).
Величина , обозначаемая , называется предельной ошибкой выборки. Следовательно,
; ,
где — предельная (максимально возможная) ошибка средней;
- предельная (максимально возможная) ошибка доли;
- величина средней квадратической стандартной ошибки;
t — коэффициент кратности средней ошибки выборки, зависящий от вероятности, с которой гарантируется величина предельной ошибки.
В зависимости от принятой вероятности Р определяется значение коэффициента кратности (t) по удвоенной нормированной функции Лапласа (см. приложение 3).
Величина средней ошибки в условиях большой выборки ( п > 30) рассчитывается по известным из теории вероятностей формулам:
а) при случайной повторной выборке:
; ;
б) при случайной бесповторной выборке:
; .
При расчете ошибок возникает существенное затруднение: величины и р по генеральной совокупности неизвестны. Эти величины в условиях большой выборки заменяют величинами S (выборочная дисперсия) и w (выборочная доля), рассчитанными по выборочным данным. В табл. 1 приведены формулы расчета ошибок простой случайной выборки.
Таблица 1
Формулы ошибок простой случайной выборки
Способ отбора единиц | ||
Повторный | Бесповторный | |
Средняя ошибка : для средней | ||
для доли | ||
Предельная ошибка : для средней | ||
для доли |
Формулы предельной ошибки позволяют решать задачи трех видов:
1. Определение пределов генеральных характеристик с заданной степенью надежности (доверительной вероятностью) на основе показателей, полученных по данным выборки.
Доверительные интервалы для генеральной средней -
; .
Доверительные интервалы для генеральной доли —
; .
2. Определение доверительной вероятности того, что генеральная характеристика может отличаться от выборочной не более чем на определенную заданную величину.
Доверительная вероятность является функцией от t, определяемой по формуле
.
По величине t определяется доверительная вероятность (приложение 3).
3. Определение необходимого объема выборки, который с практической вероятностью обеспечивает заданную точность выборки.
Для расчета объема выборки необходимо иметь следующие данные:
а)размер доверительной вероятности (Р);
б) коэффициент t, зависящий от принятой вероятности (определяется по приложению 3);
в) величину 2 (или pq)в генеральной совокупности; они за
меняются величинами, полученными в предшествующих обследованиях или при пробных выборках;
Таблица 2
Формулы для определения численности простой случайной выборки
Способ отбора единиц | ||
повторный | бесповторный | |
Численность выборки (п): для средней | ||
для доли1 | ||
1В случаях, когда частость w даже приблизительно неизвестна, в расчет вводят максимальную величину дисперсии доли, равную 0,25 (если w = 0,5, то w(1-w) = 0,25 |
г) величину максимально допустимой ошибки ( или );
д) объем генеральной совокупности (N).
Необходимый объем выборки определяется на основе допустимой величины ошибки: или .
В табл. 4.2 приведены формулы для расчета численности простой случайной выборки.
Дата добавления: 2015-11-10; просмотров: 1995;