Общие принципы анализа данных
Глава 4. АНАЛИЗ ЭМПИРИЧЕСКИХ ДАННЫХ
Собранные в эмпирическом исследовании факты получили в социологии название данных. Данные — первичная информация, полученная в результате социологического исследования; ответы респондентов, оценки экспертов, результаты наблюдения в т.п. Данные можно также определить как совокупность значений переменных, приписанных единицам исследования — объектам (людям, вещам, учреждениям).
Понятия «социологические данные» и «эмпирические данные» в учебниках и словарях, как правило, специально не определяются и обычно считаются синонимами. Такого рода понятия считаются чем-то само собой разумеющимся, привычным, знакомым для каждого профессионального социолога. Эмпирические данные появляются только на определенном )тапе — после проведения полевого обследования (массового сбора информации на объектах), они содержатся в заполненных анкетах, протоколах наблюдения, опросных листах, бланках интервью. В узком смысле слова термин «данные» относится только к данным из регистрационных документов (анкет, бланков интервью, протоколов наблюдения и т.п.). В качестве данных выступают как обработанные, так и не обработанные на компьютере результаты исследования. Обработкой социологической информации называют математико-статистическое преобразование данных, которое делает их компактными, пригодными для анализа и интерпретации. С социологическими данными можно производить следующие операции: 1) подготавливать их для обработки; шифровать, кодировать и т.д.; 2) обрабатывать (вручную или с помощью компьютера); табулировать, рассчитывать многомерные распределения признаков, классифицировать и т.д.; 3) анализировать и 4) интерпретировать2.
Общие принципы анализа данных
Анализ данных представляет собою своеобразную «вершину» всей процедуры социологического исследования, ее результат, ради которого все собственно и проделывается. Этому этапу исследования посвящен огромный пласт специальной литературы. Может возникнуть вопрос — зачем же нужна еще одна работа, что в ней можно сказать нового, такого, что еще не было сказано другими авторами? Дело в том, что абсолютное большинство работ на эту тему, написанных на достаточно высоком теоретическом уровне, предназначены главным образом для специалистов. И даже специальные учебники и учебные пособия адресованы прежде всего студентам социологических специальностей.
Между тем сегодня все чаще прикладные социологические исследования становятся инструментом профессиональной деятельности маркетологов, финансистов, политологов, журналистов и др. Поэтому мы и поставили перед собой задачу максимально краткого изложения основных методов социологического анализа на достаточно элементарном уровне — для непрофессиональных социологов и студентов несоциологических специальностей.
По мнению известного российского социолога В.А. Ядова, «анализ собранной информации — самый увлекательный этап исследования». Вероятно, это действительно так, поскольку анализ представляет собою своеобразный «венец» длительной, кропотливой работы, именно здесь исследователь может определенно выяснить, насколько верными оказались выдвинутые им в самом начале рабочие гипотезы.
Само слово «анализ»5 имеет ряд значений, однако практически всегда оно связано с расчленением исследуемого объекта на отдельные элементы. Такая операция нередко бывает сопряжена с ситуацией, когда «за деревьями не видят леса». Другими словами, излишнее сосредоточение внимания на отдельном элементе может принести к утрате понимания связи его с другими элементами объекта, когда мы перестаем понимать значение изучения объекта в целом. Поэтому в ходе аналитической работы не следует забывать, что итогом научного исследования должно стать сведение частных выводов, полученных в результате изучения отдельных элементов, в единое целое. Анализ неразрывно связан с синтезом.
Ю. Толстова указывает на существование не менее четырех различных (хотя и связанных между собою) смыслов понятия «анализ данных» в социологии: 1) совокупность действий, совершаемых в процессе изучения полученных эмпирических данных, для того чтобы сформировать представление о характеристиках изучаемого явления; 2) процесс изучения статистических данных с помощью неких приемов, математических методов и моделей с целью более удобного и наглядного их представления, что позволяет наиболее обоснованно интерпретировать изучаемое явление; 3) понятие, тождественное прикладной статистике; 4) такие процедуры «свертывания» информации, которые не допускают формального алгоритмического подхода.
Перспектива изучения эмпирических методов исследования социальных явлений иногда представляется студентам пугающей. Некоторых людей с «гуманитарным» складом ума этот этап отталкивает тем, что он включает в себя работу с числами (вычислениями) и статистику. Однако нельзя не видеть того, что достаточно глубокое знание самых разнообразных процессов, протекающих в обществе (включая политические явления, поведение покупателей и продавцов на рынках, изменение систем норм и ценностей), не-возможно без базового знания статистики и использования ее в анализе и описании исследований. Впрочем, те методы обработки и математические процедуры, которые мы намереваемся описать здесь, достаточно элементарны, это всего лишь первое приближение для строгой и дисциплинированной аргументации.
Вообще говоря, аналитическая работа, по сути, начинается с этапа разработки программы исследования. Одним из разделов технико-методической части программы является «Логическая схема обработки и анализа данных». Она представляет собою
краткое описание алгоритма действий исследователя в процессе математической и логической обработки полученной базы данных, своеобразный «маршрут» процедуры обработки. Это и в самом деле похоже на прокладку по карте маршрута движения перед тем, как пуститься в путь. Вы можете проводить обработку данных самостоятельно, но даже если расчеты будет проводить кто-то другой (например, математик, оператор, лаборант), а на вас лежат только задачи анализа результатов, вам, как социологу-исследователю, необходимо подготовить ему грамотное техническое задание — алгоритм операций. Если вы производите обработку данных на компьютере (например, с помощью пакета SPSS), то более или менее подробная логическая схема анализа будет включать в себя перечень команд в той последовательности, в которой вы будете задавать их компьютеру.
При этом нужно помнить, что достоверность и качество результатов статистической обработки в немалой степени зависят от того, насколько аккуратно и тщательно проделана работа по формированию базы данных (так называемая «набивка»). Внимательность, точность и быстрота — вот основные качества, требуемые от оператора при вводе первичной социологической информации.
Довольно полезной предварительной работой, предшествующей обработке данных, может оказаться составление так называемого словаря переменных. Это таблица, где сведены переменные данного исследования с указанием всех возможных значений, которые может принимать каждая из них, с соответствующими кодами, а также номеров тех позиций, которые занимает данная переменная в матрице базы данных. В табл. 4.1 можно увидеть пример такого словаря переменных.
Прежде чем перейти к описанию конкретных методов обработки и анализа данных, следует кратко остановиться на общих принципах, служащих основанием для любого анализа. Сущность процесса обработки первичной информации состоит в ее обобщении. Собранная в ходе полевого этапа первичная социологическая информация представляет собою массив «сырых» данных (например, пачку заполненных анкет). Эта информация не структурирована, она недоступна обозрению и не поддается непосредственному изучению. Поэтому самым первым шагом, который предстоит сделать в направлении анализа, является ее упорядочивание, уплотнение и компактное описание. Этот процесс осуществляется с помощью статистической группировки данных8.
Таблица 4.1 Словарь переменных для исследования представлений о богатстве (фрагмент)
Номер переменной | Переменная | Варианты значений | Номер позиций |
V1 | Самоидентификация себя и своей семьи с категорией богатых людей | 0 — нет ответа Определенно да в принципе да пожалуй, нет определенно нет затрудняются ответить | |
V2 | Установка на достижение богатства как цель | 0 —нет ответа Обязательно вероятно, да если получится, то не против им этого не надо не знают, не думали | |
….. | |||
V84 | Партии, предлагающие надежный путь к благосостоянию | 0 — нет ответа Аграрная Партия России КПРФ ЛДПР Наш Дом Россия Новая Сила Отечество Правое дело Россия молодая Союз справедливости и труда Трудовая Россия Честь и Родина Яблоко Другие Никакие | 84-85 |
V85 | Пол | 0 —нет ответа Мужской женский | |
… | … | … | … |
Метод группировки заключается в том, что обследуемая совокупность расчленяется на однородные группы (т.е. отдельные единицы которых обладают общим для всех признаком). Группировки по количественным или качественным признакам имеют свои специфические особенности. В случае группировки по количественным признакам (возраст, стаж работы, размер дохода) весь диапазон изменения переменной разбивают на определенные интервалы с последующим подсчетом числа единиц, входящих в каждый из них. При группировке по качественным признакам должна быть предусмотрена возможность отнесения каждой из единиц анализа к одной из выделенных градаций. Причем делать это необходимо однозначным образом с тем, чтобы суммарное число единиц анализа, отнесенных ко всем градациям, было бы в точности равно общей численности изучаемой совокупности (поэтому наряду с вариантами ответов типа «не знаю», «затрудняюсь ответить», в словаре переменных всегда предусматривается вариант «нет ответа», кодируемый обычно нулем).
Другой важной процедурой упорядочения данных, предшествующей собственно анализу, выступает типологизация. Этим понятием обозначают «обобщение признаков социальных явлений на основе идеальной теоретической модели и по теоретически обоснованным критериям». В качестве примера типологизации мы могли бы привести наше исследование, посвященное выявлению содержательного аспекта политической стратификации российского общества 1990-х гг. В этом исследовании мы выделяли такие типы политической ориентации, как «демократы», «западники», «прагматики», «коммунисты», «национал-патриоты» и «тоталитаристы».
При обработке данных нужно помнить, что, во-первых, математический аппарат, используемый в эмпирической и прикладной социологии, зачастую предлагает для выявления связи между явлениями, а также ее направления и силы довольно большое число специализированных процедур, многие из которых выглядят весьма сложно и громоздко. Выбор их для конкретного исследования зависит как от задач (формулируемых гипотезой), так и от уровня подготовки исследователя. Однако необходимо отметить, что во многих случаях изощренный математический аппарат, превращающийся из средства в некую самоцель, может лишить выводы четкости и «прозрачности». Практика проведения исследований показывает, что можно провести достаточно убедительный анализ социологических данных, используя не слишком широкий набор вычислительных средств. Не следует забывать, что главное в статистическом анализе — это прежде всего поиск социологического смысла, заключенного в полученных в результате расчета таблицах, диаграммах и индексах.
Во-вторых, социологический анализ предназначен для достижения конкретных, заранее намеченных целей, установления связей между различными социальными явлениями, сформулированных в виде рабочих гипотез. Почти всегда мы должны заранее знать, чего мы хотим, чего ищем, на какие вопросы желаем получить ответ. Конечно, возможны и случайные открытия, но вряд л и стоит на них рассчитывать. Таким образом, успех анализа в огромной степени зависит от подготовительного периода и во многом закладывается на этапе разработки программы.
Дата добавления: 2016-04-11; просмотров: 3763;