Общие принципы анализа данных

Глава 4. АНАЛИЗ ЭМПИРИЧЕСКИХ ДАННЫХ

Собранные в эмпирическом исследовании факты получили в социологии название данных. Данные — первичная информация, полученная в результате социологического исследования; ответы респондентов, оценки экспертов, результаты наблюдения в т.п. Данные можно также определить как совокупность значений пе­ременных, приписанных единицам исследования — объектам (лю­дям, вещам, учреждениям).

Понятия «социологические данные» и «эмпирические дан­ные» в учебниках и словарях, как правило, специально не оп­ределяются и обычно считаются синонимами. Такого рода по­нятия считаются чем-то само собой разумеющимся, привыч­ным, знакомым для каждого профессионального социолога. Эмпирические данные появляются только на определенном )тапе — после проведения полевого обследования (массового сбора информации на объектах), они содержатся в заполнен­ных анкетах, протоколах наблюдения, опросных листах, блан­ках интервью. В узком смысле слова термин «данные» отно­сится только к данным из регистрационных документов (анкет, бланков интервью, протоколов наблюдения и т.п.). В качестве данных выступают как обработанные, так и не обработанные на компьютере результаты исследования. Обработкой социо­логической информации называют математико-статистическое преобразование данных, которое делает их компактными, при­годными для анализа и интерпретации. С социологическими данными можно производить следующие операции: 1) подго­тавливать их для обработки; шифровать, кодировать и т.д.; 2) обрабатывать (вручную или с помощью компьютера); табу­лировать, рассчитывать многомерные распределения признаков, классифицировать и т.д.; 3) анализировать и 4) интерпре­тировать2.

Общие принципы анализа данных

Анализ данных представляет собою своеобразную «вершину» всей процедуры социологического исследования, ее результат, ради которого все собственно и проделывается. Этому этапу ис­следования посвящен огромный пласт специальной литературы. Может возникнуть вопрос — зачем же нужна еще одна работа, что в ней можно сказать нового, такого, что еще не было сказано дру­гими авторами? Дело в том, что абсолютное большинство работ на эту тему, написанных на достаточно высоком теоретическом уровне, предназначены главным образом для специалистов. И даже специальные учебники и учебные пособия адресованы прежде всего студентам социологических специальностей.

Между тем сегодня все чаще прикладные социологические исследования становятся инструментом профессиональной дея­тельности маркетологов, финансистов, политологов, журналистов и др. Поэтому мы и поставили перед собой задачу максимально краткого изложения основных методов социологического анали­за на достаточно элементарном уровне — для непрофессиональных социологов и студентов несоциологических специальностей.

По мнению известного российского социолога В.А. Ядова, «анализ собранной информации — самый увлекательный этап ис­следования». Вероятно, это действительно так, поскольку анализ представляет собою своеобразный «венец» длительной, кропотли­вой работы, именно здесь исследователь может определенно вы­яснить, насколько верными оказались выдвинутые им в самом начале рабочие гипотезы.

Само слово «анализ»5 имеет ряд значений, однако практически всегда оно связано с расчленением исследуемого объекта на отдельные элементы. Такая операция нередко бывает сопряжена с ситуа­цией, когда «за деревьями не видят леса». Другими словами, излиш­нее сосредоточение внимания на отдельном элементе может при­нести к утрате понимания связи его с другими элементами объек­та, когда мы перестаем понимать значение изучения объекта в целом. Поэтому в ходе аналитической работы не следует забывать, что итогом научного исследования должно стать сведение частных выводов, полученных в результате изучения отдельных элементов, в единое целое. Анализ неразрывно связан с синтезом.

Ю. Толстова указывает на существование не менее четырех различных (хотя и связанных между собою) смыслов понятия «анализ данных» в социологии: 1) совокупность действий, совершаемых в процессе изучения полученных эмпирических дан­ных, для того чтобы сформировать представление о характерис­тиках изучаемого явления; 2) процесс изучения статистических данных с помощью неких приемов, математических методов и моделей с целью более удобного и наглядного их представления, что позволяет наиболее обоснованно интерпретировать изучаемое явление; 3) понятие, тождественное прикладной статистике; 4) та­кие процедуры «свертывания» информации, которые не допуска­ют формального алгоритмического подхода.

Перспектива изучения эмпирических методов исследования со­циальных явлений иногда представляется студентам пугающей. Некоторых людей с «гуманитарным» складом ума этот этап оттал­кивает тем, что он включает в себя работу с числами (вычисления­ми) и статистику. Однако нельзя не видеть того, что достаточно глубокое знание самых разнообразных процессов, протекающих в обществе (включая политические явления, поведение покупателей и продавцов на рынках, изменение систем норм и ценностей), не-возможно без базового знания статистики и использования ее в анализе и описании исследований. Впрочем, те методы обработки и математические процедуры, которые мы намереваемся описать здесь, достаточно элементарны, это всего лишь первое приближе­ние для строгой и дисциплинированной аргументации.

Вообще говоря, аналитическая работа, по сути, начинается с этапа разработки программы исследования. Одним из разделов технико-методической части программы является «Логическая схема обработки и анализа данных». Она представляет собою

краткое описание алгоритма действий исследователя в процессе математической и логической обработки полученной базы данных, своеобразный «маршрут» процедуры обработки. Это и в самом деле похоже на прокладку по карте маршрута движения перед тем, как пуститься в путь. Вы можете проводить обработку данных само­стоятельно, но даже если расчеты будет проводить кто-то другой (например, математик, оператор, лаборант), а на вас лежат толь­ко задачи анализа результатов, вам, как социологу-исследовате­лю, необходимо подготовить ему грамотное техническое задание — алгоритм операций. Если вы производите обработку данных на компьютере (например, с помощью пакета SPSS), то более или менее подробная логическая схема анализа будет включать в себя перечень команд в той последовательности, в которой вы будете задавать их компьютеру.

При этом нужно помнить, что достоверность и качество резуль­татов статистической обработки в немалой степени зависят от того, насколько аккуратно и тщательно проделана работа по фор­мированию базы данных (так называемая «набивка»). Вниматель­ность, точность и быстрота — вот основные качества, требуемые от оператора при вводе первичной социологической информации.

Довольно полезной предварительной работой, предшествую­щей обработке данных, может оказаться составление так называ­емого словаря переменных. Это таблица, где сведены переменные данного исследования с указанием всех возможных значений, которые может принимать каждая из них, с соответствующими кодами, а также номеров тех позиций, которые занимает данная переменная в матрице базы данных. В табл. 4.1 можно увидеть пример такого словаря переменных.

Прежде чем перейти к описанию конкретных методов обработ­ки и анализа данных, следует кратко остановиться на общих прин­ципах, служащих основанием для любого анализа. Сущность про­цесса обработки первичной информации состоит в ее обобщении. Собранная в ходе полевого этапа первичная социологическая ин­формация представляет собою массив «сырых» данных (например, пачку заполненных анкет). Эта информация не структурирована, она недоступна обозрению и не поддается непосредственному изучению. Поэтому самым первым шагом, который предстоит сделать в направлении анализа, является ее упорядочивание, уп­лотнение и компактное описание. Этот процесс осуществляется с помощью статистической группировки данных8.

 

Таблица 4.1 Словарь переменных для исследования представлений о богатстве (фрагмент)

 

Номер переменной Переменная Варианты значений Номер позиций
V1 Самоидентификация себя и своей семьи с категорией богатых людей 0 — нет ответа Определенно да в принципе да пожалуй, нет определенно нет затрудняются ответить
V2 Установка на достижение богатства как цель 0 —нет ответа Обязательно вероятно, да если получится, то не против им этого не надо не знают, не думали
    …..  
V84 Партии, предлагающие надежный путь к благосостоянию 0 — нет ответа Аграрная Партия России КПРФ ЛДПР Наш Дом Россия Новая Сила Отечество Правое дело Россия молодая Союз справедливости и труда Трудовая Россия Честь и Родина Яблоко Другие Никакие 84-85
V85 Пол 0 —нет ответа Мужской женский

Метод группировки заключается в том, что обследуемая сово­купность расчленяется на однородные группы (т.е. отдельные еди­ницы которых обладают общим для всех признаком). Группиров­ки по количественным или качественным признакам имеют свои специфические особенности. В случае группировки по количе­ственным признакам (возраст, стаж работы, размер дохода) весь диапазон изменения переменной разбивают на определенные ин­тервалы с последующим подсчетом числа единиц, входящих в каждый из них. При группировке по качественным признакам должна быть предусмотрена возможность отнесения каждой из единиц анализа к одной из выделенных градаций. Причем делать это необходимо однозначным образом с тем, чтобы суммарное число единиц анализа, отнесенных ко всем градациям, было бы в точности равно общей численности изучаемой совокупности (по­этому наряду с вариантами ответов типа «не знаю», «затрудняюсь ответить», в словаре переменных всегда предусматривается вари­ант «нет ответа», кодируемый обычно нулем).

Другой важной процедурой упорядочения данных, предшеству­ющей собственно анализу, выступает типологизация. Этим поня­тием обозначают «обобщение признаков социальных явлений на основе идеальной теоретической модели и по теоретически обо­снованным критериям». В качестве примера типологизации мы могли бы привести наше исследование, посвященное выявлению содержательного аспекта политической стратификации российс­кого общества 1990-х гг. В этом исследовании мы выделяли та­кие типы политической ориентации, как «демократы», «западни­ки», «прагматики», «коммунисты», «национал-патриоты» и «тота­литаристы».

При обработке данных нужно помнить, что, во-первых, мате­матический аппарат, используемый в эмпирической и приклад­ной социологии, зачастую предлагает для выявления связи меж­ду явлениями, а также ее направления и силы довольно большое число специализированных процедур, многие из которых выгля­дят весьма сложно и громоздко. Выбор их для конкретного иссле­дования зависит как от задач (формулируемых гипотезой), так и от уровня подготовки исследователя. Однако необходимо отме­тить, что во многих случаях изощренный математический аппа­рат, превращающийся из средства в некую самоцель, может ли­шить выводы четкости и «прозрачности». Практика проведения исследований показывает, что можно провести достаточно убеди­тельный анализ социологических данных, используя не слишком широкий набор вычислительных средств. Не следует забывать, что главное в статистическом анализе — это прежде всего поиск со­циологического смысла, заключенного в полученных в результате расчета таблицах, диаграммах и индексах.

Во-вторых, социологический анализ предназначен для дости­жения конкретных, заранее намеченных целей, установления свя­зей между различными социальными явлениями, сформулирован­ных в виде рабочих гипотез. Почти всегда мы должны заранее знать, чего мы хотим, чего ищем, на какие вопросы желаем по­лучить ответ. Конечно, возможны и случайные открытия, но вряд л и стоит на них рассчитывать. Таким образом, успех анализа в огромной степени зависит от подготовительного периода и во многом закладывается на этапе разработки программы.








Дата добавления: 2016-04-11; просмотров: 3769;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.008 сек.