Тема 6 ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Сущность выборочного наблюдения
Виды и способы выборочного наблюдения
Оценивание генеральной средней и генеральной доли
Определение численности выборки
1.
Идея выборки для принятия решения существует с давних времен. Купец, покупая пшеницу, не просматривал весь товар, а ограничивался несколькими пробами. В начале 20 в. На заседании Международного статистического института была принята резолюция о том, что выборка может дать точные результаты, если соблюдать условия отбора единиц совокупности.
Теоретические основы выборочного метода создали представители российской школы теории вероятностей Чебышев, Ляпунов, Марков.
Первое выборочное наблюдение под руководством крупного математика Лапласа в масштабах страны проведено во Франции. В 1802 г. была проведена перепись населения. Выборка охватила 7% (ошибка меньше полмиллиона).
Выборочное наблюдение -важнейший вид несплошного статистического наблюдения. Оно представляет собой такой вид статистического наблюдения, при котором обследованию подвергается некоторая часть единиц изучаемой совокупности, отобранная в определенном строго научном порядке, с целью последующей характеристики совокупности.
Следовательно, выборочное наблюдение организуют т.о., чтобы отобранная часть единиц совокупности представляла всю совокупность. Отобранную часть единиц совокупности называют выборочной совокупностьюили выборкой.В этом случае всю статистическую совокупность называют генеральной.
В отличие от других видов несплошного наблюдения показатели, которые рассчитаны на основе выборки, могут быть применены для оценки аналогичных показателей в генеральной совокупности. Это и значит, что выборочная совокупность представляет генеральную совокупность.
Выборочная совокупность будет представительной или репрезентативнойтолько в том случае, если соблюдаются основные принципы отбора выборки:
1) каждая единица генеральной совокупности должна иметь равную возможность попасть в выборку , т.е. должен соблюдаться принцип случайного отбора;
2) отобранная выборочная совокупность должна в основных чертах отражать структуру генеральной совокупности.
При проведении любого статистического наблюдения возникает ошибка регистрации. При проведении выборочного наблюдения кроме ошибки регистрации возникает ошибка выборки (ошибка репрезентативности), которая представляет собой разницу между величиной статистического показателя, рассчитанного по выборке, и величиной того же показателя, который был бы получен при проведении сплошного наблюдения.
Ошибки репрезентативности могут быть случайными и систематическими.
Случайная ошибка выборкивозникает всегда, ее величина зависит от следующих факторов:
1) способ формирования выборочной совокупности (повтореный и бесповторный);
2) объем выборки (чем больше объем, тем меньше ошибка);
3) степень колеблемости изучаемого признака в генеральной совокупности (чем выше степень колеблемости, тем больше ошибка).
Систематические ошибки возникают тогда, когда нарушаются принципы отбора в выборочную совокупность
(Пример с выборами. В 1936 году журналом “Literary Digest” проводился опрос: кто будет президентом: Альфред Лэндон или Франклин Рузвельт? Опрос среди подписчиков журнала и по телефонным справочникам => нарушен принцип случайного отбора => непреднамеренная систематическая ошибка).
Зачем нужно выборочное наблюдение?
Причины проведения выборочного наблюдения:
1) экономия средств и времени при проведении наблюдения;
2) невозможность сплошного наблюдения (полный контроль качества);
3) т.к. выборочное наблюдение обычно небольшое, то его проводят более тщательно, чем сплошное наблюдение, что приводит к резкому снижению ошибки регистрации. Суммарная ошибка регистрации и репрезентативности выборочного наблюдения достаточно часто будет меньше, чем ошибка сплошного наблюдения.
Сферы применения выборочного наблюдения:
1) статистический контроль качества продукции (задается % брака и если в выборке он меньше, то вся партия годна);
2) изучение общественного мнения (с 1935 г. В США опрос институтом Гэллапа, примерно 1500 чел.);
3) бюджетное обследование;
4) контроль за использованием рабочего времени (метод моментальных наблюдений);
5) расширение программы переписи населения (25% по расширенной программе).
Основные этапы выборочного наблюдения:
1) определение цели, задач и составление программы наблюдения;
2) формирование выборки;
3) сбор данных на основе разработанной программы;
4) расчет основных характеристик выборки;
5) расчет ошибок выборки и распространение её результатов на генеральную совокупность.
2.
1. Простая случайная выборка.При проведении такой выборки отбор единиц совокупности в выборочную совокупность проводится случайным образом без предварительного разделения генеральной совокупности на группы. В зависимости от способа отбора единиц совокупности различают повторную и бесповторную случайные выборки.
Повторная выборкаосуществляется по схеме возвращенного шара.
Бесповторная выборка –по схеме невозвращенного шара.
2. Типичная (районированная) выборка. Этот тип выборки используется в том случае, если заранее известно, что генеральная совокупность неоднородна, и в ней представлены какие-то типы явлений. В этом случае генеральная совокупность разбивается на группы, и отбор производится из каждой группы в случайном порядке. Таким образом, типическая выборка опирается на группировку.
Число единиц совокупности, отобранных из каждой группы, обычно пропорционально удельному весу численности групп в генеральной совокупности. Районированная выборка опирается на территориальное деление (города, поселки и т.п.). Ошибка типической выборки всегда меньше, чем ошибка простой случайной выборки, т.к. группировка снижает колеблемость признака.
3. Серийная выборка. При проведении такой выборки в случайном порядке выбираются не единицы совокупности, а их группы, которые называются сериями. Серии подвергаются сплошному наблюдению. (Пример: проверка качества упакованной в тару продукции; отбирают в случайном порядке ящики, а затем проверяют качество упакованной в них продукции. Случайную выборку можно проводить в 2 этапа: отбор серии, а затем отбор в них единиц совокупности). Ошибка серийной выборки больше, чем ошибка простой, т.к. для проверки отбирают малое число серий.
4. Механическая выборка -самый распространенный вид выборки. При проведении выборки все единицы совокупности располагаются в определенном порядке, а затем, в зависимости от заданного объема выборки отбирается, например, каждая сотая единица совокупности, если проводится однопроцентная выборка.
Механическая выборка является бесповторной случайной выборкой. Если генеральная совокупность бесконечна, то её, с точки зрения ошибки выборки, рассматривают как повторную простую выборку (обследование покупок).
Если имеется возможность проранжировать единицы совокупности по величине изучаемого признака, то это понизит ошибку выборки.
3.
Оценивание генеральной средней и генеральной доли рассмотрим для простой случайной выборки или собственно случайной выборки.
Запишем обозначения, принятые в теории выборки.
N – численность генеральной совокупности.
п – объём выборки.
– генеральная средняя, т.е. средняя, которая была бы получена при проведении сплошного наблюдения.
– средняя, рассчитанная по данным выборки.
р – генеральная доля, т.е. доля единиц совокупности, обладающих каким-то значением признака в генеральной совокупности.
w – выборочная доля, рассчитанная по данным выборки.
σ2 – генеральная дисперсия.
S2– выборочная дисперсия, т.е. дисперсия признака, рассчитанная по выборке.
Оценить генеральный статистический показатель (среднюю величину или долю) – значит указать пределы, в которых находится этот показатель в генеральной совокупности с заданным уровнем вероятности.
Оценивание генеральных статистических показателей основано на теоретических разработках крупнейших математиков начала 20 века Чебышева, Ляпунова, Бернулли, Пуассона.
В соответствии с теорией генеральная средняя находится в следующих пределах:
– ошибка выборки (предельная ошибка), т.к. представляет собой разницу между и .
t– критерий надежности.
– средняя квадратическая ошибка выборки, которая рассчитывается:
– формула для повторной выборки.
Если численность в выборочной совокупности >30 единиц, то σ2 считают = S2, если же численность <30 единиц, то .
Для бесповторной выборки используют следующую формулу:
Ошибка для повторной выборки больше, чем для бесповторной.
Величина t зависит от уровня задаваемой вероятности и находится в специальных статистических таблицах.
Извлечение из статистической таблицы.
t | 1,0 | 1,96 | 2,0 | 2,58 | 3,0 |
P(t) | 0,683 | 0,95 | 0,954 | 0,99 | 0,997 |
Аналогично оценивается генеральная доля:
– ошибка выборки для доли, т.е. разница между w и p
= t · μp
t – критерий надёжности, его величина зависит от уровня задаваемой вероятности.
Mp – средняя ошибка выборки для доли.
– повторная выборка.
– дисперсия альтернативного признака.
– бесповторная выборка.
4.
На стадии организации выборочного наблюдения необходимо определить объём выборки, который обеспечил бы требуемую точность наблюдения. Этот объём определяют исходя из формул ошибок выборки.
Для простой повторной выборки
Величины t и задаются, а неизвестно.
Существуют следующие подходы к определению величины дисперсии ( ):
1) проводят пробное выборочное наблюдение небольшого объёма и находят дисперсию по формуле , где – средняя величина признака по выборочному наблюдению.
2) если есть основания считать, что изучаемый признак распределён в генеральной совокупности симметрично, то , поскольку для таких распределений размах вариации
3) можно использовать данные о величине дисперсии в предыдущих аналогичных выборочных наблюдениях.
Достаточно часто на практике задаётся не величина , а относительная погрешность, выраженная в % к средней величине признака.
Эту величину подставим в формулу для определения объёма выборки.
– коэффициент вариации.
Пример. По данным пробного выборочного наблюдения известно, что коэффициент вариации признака 40%. Сколько нужно отобрать единиц в выборочную совокупность, чтобы с вероятностью 0,954 относительная ошибка выборки не превысила 5%.
единиц
Для бесповторной выборки ошибка имеет следующий вид:
Объём бесповторной выборки всегда меньше объёма повторной выборки.
Пример.Чему должен быть равен объём выборки, чтобы ошибка выборки для среднего тарифного разряда, рассчитанная выше, уменьшилась в два раза?
(человек).
Аналогично определяется численность выборки для оценивания генеральной доли.
– для повторной выборки.
– для бесповторной выборки.
Max
Часто при определении объёма выборки при оценивании генеральной доли принимаем 0,25.
Если по одной и той же выборке нужно изучить различные признаки и оценить различные показатели: возраст, уровень жизни и так далее, то нужно рассчитать необходимую численность выборки для оценивания каждого показателя, а затем выбрать максимальную и проводить выборочное наблюдение такого объёма.
\
Тема 7 ИНДЕКСЫ
Дата добавления: 2016-06-13; просмотров: 2271;