Зачем нужна выборка
Глава 2. ТЕОРИЯ И МЕТОДОЛОГИЯ ВЫБОРКИ
Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование именуется выборочным.
Выборочное обследование представляет собой способ систематического сбора данных о поведении и установках людей посредством опроса специально подобранной группы респондентов, дающих информацию о себе и своем мнении. Оно является более экономичным и не менее надежным методом, чем сплошное исследование, хотя требует более изощренной методики и техники.
Зачем нужна выборка
Правильная выборка — залог успеха и необходимая предпосылка любого опроса, если это не общенациональная перепись населения. Если социолог неправильно составил выборочную совокупность, т.е. группу людей, которую собирается опросить, результаты исследования окажутся неверными, а потому и никому не нужными.
Почему нерационально и практически невозможно опрашивать всех людей, составляющих объект исследования?
Можно приблизительно рассчитать, во что обойдется сплошной опрос взрослых жителей хотя бы одного городского района с численностью населения, скажем, 200 тыс. чел. Учитывая, что один анкетер (интервьюер) в состоянии опросить не более трех человек в час, при семичасовом рабочем дне его выработка составит порядка 20 анкет. Это означает, что для полного сбора первичной информации нам потребуется 85 тыс. человеко-дней. Предположим, что мы намереваемся завершить опрос за 10 дней и заплатить за каждое интервью 20 руб. Таким образом, нам придется привлечь 8,5 тыс. помощников и заплатить им в общей сложности 340 тыс. руб. Какой бы важной ни была полученная информация, вряд ли она окупит столь огромные расходы, не говоря о прочих издержках. К прочим можно отнести, например, те деньги, которые теряет предприниматель, разрешая социологам отвлечь для опроса пару-тройку сотен своих рабочих, которые в этот момент не создают материальной продукции и тем самым лишают бизнесмена определенной части прибыли.
Вот почему практически всегда социологи прибегают к выборочным методам опроса.
(Исключение составляют электоральные мероприятия (выборы) и всенародные опросы (референдумы). Однако нельзя забывать, что их проводит государство).
Суть выборочного метода заключается в том, что по определенным — довольно строгим — правилам из общей численности людей, так называемой генеральной совокупности (население всей страны, все городское население, все жители одного города или района, вся молодежь и т.п.), отбирается ограниченное число людей, которое призвано в качестве своеобразной модели воспроизводить структуру объекта. На языке социологов эта группа людей (равно как и процедура по ее определению) именуется выборкой.
Правильное построение выборочной совокупности — основа и гарантия высокой точности социологического исследования. Опрашивать всю генеральную совокупность, например всех наркоманов, физически невозможно, экономически невыгодно, а в научном плане бесполезно. Ученые давно заметили, что после известного количества анкет результаты начинают повторяться, выстраиваясь в определенные закономерности. Минимальным порогом служат обычно 20 анкет (для страховки социологи условно приняли цифру 50 — некий гарантированный объем выборочной совокупности, которая позволяет ученому обнаружить общие тенденции). Если респонденты не очень сильно отличаются друг от друга, скажем, принадлежат к одной профессии, классу, полу, возрасту, то очень скоро в их ответах начинают просвечивать общие тенденции. К примеру, все 30-летние в основном женаты, редко меняют место работы и больше ориентированы на карьеру, чем 20-летние.
Выяснились и другие любопытные особенности. Скажем, чем проще вопросы, тем быстрее выявляются повторы. Чем меньше альтернатив (или, как еще говорят, закрытий) в анкетном опросе, тем через меньшее число анкет начинают проступать общие тенденции. Таким образом, в простейшем случае, если социолог не ставит целью провести фундаментальное исследование с соблюдением всех методических требований, ему лучше сконструировать несложную анкету, сделать однородную выборку и охватить небольшое число респондентов. Обычно подобные исследования называют разведывательными, постановочными, зондажными.
Разумеется, всего этого недостаточно для широкомасштабного обследования, гетерогенной выборки, разнородной и громоздкой анкеты либо для эмпирического подтверждения гипотезы, отвечающего всем требованиям научного канона. Но для пробного или, лучше сказать, постановочного исследования, где социолог не идет дальше постановки проблемы, этого вполне достаточно.
Итак, социологи отказались от сплошного исследования в пользу выборочного не только по финансовым, но и по научным соображениям. Поэтому мы должны себе сказать: собирать информацию обо всей популяции (или генеральной совокупности) не только невозможно, но часто и не нужно. Но в тех ситуациях, особенно в маркетинговом исследовании, где от социолога требуют точной информации о целой категории людей, например потребителях растворимого кофе, заказчик выделяет из своего кармана (по существу, отказывается от части прибыли) немалые деньги и исследовательская фирма рискует своим авторитетом, к выборочному опросу следует подходить по всем правилам, проявлять максимум ответственности, соблюдать все методические правила.
История свидетельствует, что когда нарушаются принципы случайной выборки и какой-то группе респондентов оказывается предпочтение — произвольно или непроизвольно, намеренно или в силу независящих от ученого обстоятельств, — происходит катастрофа. Применение смещенной или неправильно составленной выборки специалисты любят демонстрировать на примере крупного скандала, случившегося в 1930-е гг. с журналом «Литэрари дайджест», организовавшим опрос общественного мнения относительно результатов выборов. Как и любой другой дайджест, журнал в основном жил чужими материалами, перепечаткой газетных и журнальных статей, в данном случае посвященных опросам общественного мнения. Начиная с 1920 г. журнал стал заниматься организацией собственных опросов, в частности провел широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте были разосланы избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившегося журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как при такой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. Однако когда выборы состоялись, он потерпел сокрушительное поражение. Иначе говоря, Ландон проиграл Франклину Д. Рузвельту практически с тем же результатом, с которым должен был победить. Доверие читателей к «Литэрари дайджест» было серьезно подорвано, вскоре журнал перестал выходить. Такой оказалась цена методической ошибки.
Что же произошло? Все очень просто: в голосовании, проведенном «Дайджест», использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, после Великой депрессии в 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, выборка, использовавшаяся в опросе, организованном «Дайджест», была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта оказался такой хороший результат.
Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокращает объем работы (за счет уменьшения числа наблюдений), позволяет экономить силы и средства, получать информацию о таких совокупностях, полное обследование которых практически невозможно или нецелесообразно. Но происходит все это лишь в том случае, если соблюдаются научные правила выборочного исследования.
Опыт показал, что правильно произведенная выборка довольно хорошо представляет или репрезентирует (от лат. represento — представляю) структуру и состояние генеральной совокупности. Однако полного совпадения выборочных данных с данными обработки генеральной совокупности, как правило, не бывает. В этом и заключается недостаток выборочного метода, на фоне которого видны преимущества сплошного описания генеральной совокупности.
Ввиду неполного отображения выборкой статистических характеристик (параметров) генеральной совокупности перед исследователем возникает важная задача: во-первых, учитывать и соблюдать те условия, при которых выборка наилучшим образом репрезентирует генеральную совокупность, а во-вторых, в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генеральную совокупность, из которой выборка взята.
Репрезентативность выборки зависит от целого ряда условий, и прежде всего от того, как она осуществляется — или планомерно (т.е. по заранее намеченной схеме), или путем непланомерного отбора элементов из генеральной совокупности. В любом случае выборка должна быть типичной и вполне объективной. Эти требования должны выполняться неукоснительно как наиболее существенные условия репрезентативности выборки. Прежде чем обрабатывать выборочный материал, его нужно тщательно проверить и освободить выборку от всего лишнего, что нарушает условия репрезентативности. В то же время при образовании выборки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные браковать. Доброкачественная выборка должна быть объективной, т.е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав. Выполнению этого условия репрезентативности отвечает принцип рандомизации (от англ. randomization), или случайного отбора элементов из генеральной совокупности. Этот принцип положен в основу теории выборочного метода и должен соблюдаться во всех случаях образования репрезентативной выборочной совокупности, не исключая и случаев планомерного или преднамеренного отбора.
2.2. Основные понятия и сущность выборочного метода
При построении социологической выборки используется множество специальных терминов, в том числе два важнейших — генеральная и выборочная совокупности.
Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки, или выборочной совокупности. Объем генеральной совокупности обозначается символом N, а объем выборочной совокупности — и. Обычно эти символы размещают в заголовке таблице, которая получилась у социолога после анализа данных, либо в подлежащем таблицы.
Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно — на основе информации о выборочной совокупности).
В англоязычной литературе дословного аналога термину «репрезентативность» не существует. Вместо него используется другой — «популяция» (population), который, как и русское слово «генеральная совокупность», имеет два значения. Первое — генеральная совокупность, т.е. все люди, на которых мы хотим распространить полученные в своем исследовании выводы и на которых направлен наш теоретический интерес. В англоязычных источниках так и пишут: «population of interest».
Второе значение — список людей, на основании которого составляется позже выборочная совокупность. Их называют единицами наблюдения. Они считаются элементами генеральной совокупности. Список единиц наблюдения, который нумеруется с использованием таблицы случайных чисел, в отечественной литературе специального названия не имеет, как не имеет он такового и в англоязычной социологии.
Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях.
♦ Выборка (как результат действия) — представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности.
♦ Выборка (как способ или процесс действия) — способ отбора объектов генеральной совокупности в выборочную.
Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).
(Подлежащим таблицы называется объект, который характеризует таблица при
помощи числовых данных).
Выборочная совокупность — уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т.е. темой, выступает экономическая активность пенсионеров. Все пенсионеры — пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет — будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тыс. пенсионеров. Это и станет его выборочной совокупностью.
Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку.Но как этого добиться? Прежде всего надо узнать как можно больше свойств, или параметров генеральной совокупности, например разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией, конкретные величины возраста — значениями, а совокупность всех значений образует переменную.
Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0—5, 6—10, 11—15 лет и т.д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.
Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность — это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса5. Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.
Итак, совокупность людей, на которую вы распространяете свои выводы, называется генеральной совокупностью, популяцией, группой интереса (такое название происходит от направленности теоретического интереса ученого).
Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность, решают математические методы. Если социолог намеревается взглянуть на Афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать придется небольшую часть — выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, возможно, затрудняющих его поиск, должен иметь одинаковую вероятность попасть в выборочную совокупность.
Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов — об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.
Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки — наличие информации о генеральной совокупности, т.е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.
Пол репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем6 генеральной совокупности. Иными словами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Такое распространение результатов в зарубежной литературе называют генерализуемостью.
Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5%. Практика работы социологов позволяет с достаточной надежностью проводить репрезентативные опросы, руководствуясь элементарными правилами. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100—250 чел.) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25% от общего числа студентов.
Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки. После чего решается вопрос отипе выборки.
Типами выборки называются основные разновидности статистической выборки: случайная (вероятностная) и неслучайная (невероятностная). Вместо термина «тип выборки» часто употребляют слова «вид» и «разновидность», что также правильно. Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.
Методом выборки будем называть способ построения того типа выборки, название которого этот метод носит, например метод вероятностной выборки. В социологии методом называют основной способ сбора, обработки или анализа данных; правила и процедуры, с помощью которых устанавливается связь между фактами, гипотезами и теориями.
Для каждого типа выборки разработаны свои математические аппараты и процедуры. Так, в простой случайной выборке все элементы из списка людей, составляющих основу выборки, пронумеровываются и с помощью таблицы случайных чисел из них отбирается искомая совокупность.
Для обеспечения репрезентативности требуется полный и точный перечень единиц выборочной совокупности. Этот перечень образует основу выборки. Элементы, предназначенные для отбора, называются единицами отбора. Элемент генеральной совокупности, с которого непосредственно ведется сбор информации, называется единицей наблюдения. Обычно единица наблюдения — это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто применяется квазислучайный метод, когда из перечня простого берется каждый n-й элемент.
Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группировку, отражающую процентное распределение генеральной совокупности по каким-то важным признакам, например распределение индивидов по профессии, квалификации, полу или возрасту.
Структура выборки — процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.
Если в генеральной совокупности, например, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальности и т.д. Для каждого признака устанавливаются процентные пропорции в генеральной и выборочной совокупностях. Расхождение структуры двух совокупностей ведет к ошибке репрезентативности. Таким образом, структура выборки— процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.
Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.
В программе эмпирического исследования тщательно описывается проект выборки, который в последующем может уточняться. В проекте выборки указываются принципы выделения из объекта той совокупности людей (либо иных источников информации), которые впоследствии будут охвачены опросом; обосновывается техника проведения опроса; указываются подходы к определению достоверности полученной информации (это необходимо для того, чтобы удостовериться в степени правомерности распространения полученных выводов на весь объект исследования).
Составление выборки — процесс выбора единиц (людей, организаций и т.п.) из интересующей социолога генеральной совокупности с таким условием, чтобы, проведя свое исследование, ученый мог обобщить полученные результаты снова на всю генеральную совокупность, из которой осуществлялась выборка.
Составление выборки — очень сложная процедура, включающая множество действий и этапов, на каждом из которых социолог может допустить ошибку. Ранняя ошибка порождает последующие, нарастает снежный ком искаженной информации, который способен парализовать исследование или свести его ценность к нулю. Цепочка ошибок, сделанных самим ученым, либо одна из них называется систематической ошибкой. Например, даже если вы четко определились с генеральной совокупностью, очень сложно установить, сколько именно человек ее составляют. Или предположим, социолог установил общую численность генеральной совокупности, но он никак не может составить список лиц, представляющих собой основу выборочной совокупности. Если и эта трудность устранена, возникает новая: из списка подлежащих опросу лиц далеко не все доступны опросу. Если все респонденты готовы подвергнуться испытанию, то и в этом случае никто не даст гарантии, что они в последний момент не откажутся, дадут истинные сведения, что на их мнение никто не повлияет и т.п. Таким образом, социологический опрос превращается в рисковый бизнес, где ученого подстерегает множество трудностей, неожиданностей и неприятностей. И все надо уметь преодолевать.
Высшей пробой профессионально выполненной работы служит то обстоятельство, что социолог из одной и той же генеральной совокупности может сделать две или три выборки, которые, будучи разными по составу респондентов, дают одинаковые статистические распределения ответов. Если в первой выборке от 60 до 70% респондентов не удовлетворены трудом, то и в трех других процент неудовлетворенных должен быть таким же. Если это так, то вы сделали правильную выборку.
В практике эмпирических исследований широко употребляется понятие целевой выборки. Целевые выборки — группы физических или юридических лиц, отвечающие одному или нескольким определенным критериям, устанавливаемым ученым при организации исследования. Респонденты в целевую группу отбираются на основании фильтрующих вопросов, которые и позволяют определить соответствие этим критериям. Например, при исследованиях среди населения критерием отбора в целевую выборку может являться уровень доходов свыше 5 тыс. руб., использование компьютера не реже трех раз в неделю, наличие дома бытовой техники определенной марки. Критерии отбора зависят от задач исследования.
Выборка в количественном и качественном исследованиях строится на противоположных принципах. В первом случае она является статистической и основана на поиске гомогенной группы респондентов, совпадающих по главным признакам (например, возраст, пол, класс). Во втором случае стремятся найти непохожих людей, сделать группу респондентов гетерогенной; выбор нового респондента, объекта или ситуации происходит по принципу их противоположности и вариативности. Избегая однородности (гомогенности) выборочной совокупности, ученые таким способом стараются отразить как можно больше аспектов изучаемого явления, осветить его с разных сторон, добиваясь комплексного и всестороннего изучения. Выборка в качественном исследовании называется теоретической.
Численность выборочной совокупности варьируется здесь в диапазоне от 20 до 50 единиц. Строгих количественных параметров не существует — они зависят от задач исследования. Правда, негласно социологи используют определенный верхний предел — порог насыщения, который достигается, когда каждое последующее интервью не привносит в изучаемое явление никакого разнообразия, но лишь повторяет данные предыдущих интервью.
Это не только порог насыщения, но и точка расхождения двух стратегий. Представители количественной методологии радуются тому моменту, когда каждое последующее интервью начинает повторять предыдущее. С этой точки открываются захватывающие перспективы, как вид из окна, — социолог предчувствует появление тенденции, а возможно, и статистической закономерности. А вот его сопернику тенденции и статистика не нужны. Он ищет несхожесть, разнообразие, неповторяемость.
Дата добавления: 2016-04-11; просмотров: 4157;