Анализ документов
Одним из основных способов получения информации в социологическом исследовании является анализ документов.
Документ ― специально созданный человеком предмет, предназначенный для передачи и хранения информации. В сущности, документом является любая знаковая или образная информация, зафиксированная на каком-либо материальном носителе: в печатном или рукописном тексте, на фото-, кино- или видеопленке, на магнитофонной ленте, на микрофишах, компакт-дисках, дискетах для ЭВМ и т.д.
Для того, чтобы лучше ориентироваться в многообразии документов, используемых социологами, их принято классифицировать. Классификация может осуществляться по разным основаниям. Так, по форме фиксации содержания документы делятся на письменные, фонетические, иконографические.
- Письменные документы включают вербальные и статистические. Примером письменных вербальных документов могут служить книги, переписка организаций, пресса; примером статистических документов ― данные переписи населения, данные социологических опросов, сборники статических материалов, содержащие показатели экономического и социального развития страны или региона. Вербальные документы описывают социальные явления и процессы в форме текста. В отличие от них статистические документы содержат данные в числовой форме, чаще всего систематизированные и сведенные в таблицы.
- Фонетические документы рассчитаны на слуховое восприятие. Это грампластинки и магнитофонные записи, лазерные диски и радиоэфир.
- Иконографические документы фиксируют образную информацию, воспринимаемую визуально. Это картину и фотографии, документальное и художественное кино.
Очень часто реальные документы сочетают в себе разные формы фиксации содержания: вербальную и статистическую (научная статья, отчет), фонетическую и иконографическую (кинофильм, видеозапись).
По статусу источника все документы (письменные, фонетические, иконографические) подразделяются на личные и официальные.
1) Личные документы ― письма, семейные альбомы, дневники, т.е. все то, что создается частными лицами по собственной инициативе.
2) Официальные документы ― те, что исходят от какой-либо организации, государственной, частной или общественной, и отражают общественные связи, коллективную точку зрения. Выделяют несколько групп официальных документов. Это текущая документация, входящая и исходящая. Сюда относятся договоры и соглашения, директивы, распоряжения, приказы, а также официальная переписка. Следующая группа ― документы периодического характера, такие, как квартальные, годовые отчеты организаций и подразделений, и непериодического ― доклады, рапорты, акты различных комиссий. Существует еще архивная документация, т.е. документы государственных архивов, архивов предприятий и организаций. В зависимости от ценности архивные документы бывают постоянного и временного хранения.
Еще одно основание классификации документов ― спонтанность их появления. С этой точки зрения документы делятся на самопроизвольные, созданные независимо от исследователя, и заданные специально по просьбе исследователя (ответы на вопросы интервью, автобиографии, запись наблюдений и самонаблюдений). С точки зрения опосредованности выделяют первичные и вторичные документы: одни созданы на основе непосредственного опыта автора, другие ― на базе обобщения первичных документов. По критерию авторства документы классифицируют на индивидуальные, у которых есть один автор, и коллективные, у которых их несколько. Возможна классификация документов и по другим основаниям.
Приступая к проведению социологического исследования, важно обозначить круг документов, которые можно и нужно использовать. В ходе ОСИ среди всего разнообразия документов в первую очередь отбираются те документы, которые имеют непосредственное отношение к проблеме. Это прежде всего официальные документы, различные по своей структуре (протоколы собраний, резолюции, приказы, постановления, инструкции, заявления, жалобы). Если в данных документах имеются ссылки на другие документы и, по мнению социолога, для полноты информации не хватает фактического материала, то для анализа можно привлекать и те документы, на которые были сделаны ссылки в уже проанализированных документах. Отбор документов для ОСИ осуществляется с помощью специальной исследовательской группы, каждый из членов которой отвечает на вопрос: “В каких документах, на Ваш взгляд, можно найти материалы по изучаемой нами проблеме?” Высказанные мнения экспертов суммируются и усредняются. К работе в системе ОСИ привлекаются в первую очередь те документы, которые получили более 50% выборов экспертов.
Для анализа документов могут использоваться как неформализованные (качественные), так и формализованные (качественно-количественные) методы. Выбор метода зависит от целей и задач исследования, а также от специфики документов, с которыми имеет дело социолог.
Качественный анализ сводится к чтению документа, пониманию и интерпретации его содержания. Он основан на общих логических операциях, таких как анализ, синтез, сравнение, определение, оценивание. Качественный анализ включает внешний и внутренний аспекты. При внешнем анализе выясняются обстоятельства создания документа: время, место, авторство, причина и цель его появления. Уже одно это может многое сказать о документе т.к. в значительной степени предопределяет его содержание, специфику отражения в нем объективной реальности, оценок и выводов. Внутренний анализ сосредоточен на самом тексте. Он выявляет, как организован текст и почему он так организован; каков его жанр, действующие лица, в каких взаимоотношениях находятся персонажи и в связи с какими событиями они действуют; что в тексте описывается на первом плане, а что ― на втором, каковы языковые средства, используемые автором, и какие оттенки значений они привносят в текст. Качественный анализ может проникать в глубинные пласты содержания документа, однако он несет в себе потенциальную возможность субъективных смещений, т.к. неотделим от личности исследователя, его знаний, интуиции, опыта, убеждений. Субъективизм ― основной недостаток традиционного качественного анализа документов.
Именно с целью преодоления субъективизма стали разрабатываться приемы формализованного анализа ― контент-анализа. Важной предпосылкой его развития и распространения стала массовизация информационных процессов и связанная с этим необходимость анализа больших объемов информации. Наиболее наглядный эффект контент-анализ давал в сфере журналистики, имеющей дело с массовым производством и распространением сообщений. Поэтому контент-анализ первоначально использовался для исследований СМИ (Г.Лассуэлл, П.Лазарсфельд, И. Уилли, И.Лейтс). Со временем метод стал распространяться на изучение и других областей социальной реальности, другого типа текстов: текущей и отчетной документации организаций, протоколов собраний, личных дел, архивных материалов, а также писем, дневников, сочинений на заданную тему и т.д.
В системе ОСИ формализованный анализ документов является второй ступенью после анализа качественного, являющегося первой ступенью. Функция первой ступени – проверка правильности выбора основных понятий исследования, проводившегося на этапе диагностики в ходе логического анализа предмета исследования. Качественный анализ документов может показать необходимость дополнения набора основных понятий новыми, которые часто встречаются в изучаемых материалах.
Однако надо помнить, что не все документы пригодны для контент-анализа и не всегда его проведение имеет смысл, а лишь в том случае, если: а) объект исследования представлен большим массивом однородных документов, б) интересующие исследователя элементы содержания встречаются в документах с достаточной частотой.
Причем простое выяснение частоты употребления тех или иных слов, суждений, символов в массиве однородных документов еще нельзя считать контент-анализом в полном смысле слова. Этот метод, как правило, предполагает сравнение. Например, сопоставление двух или нескольких газет, телеканалов, радиопрограмм или сопоставление содержания одного и того же информационного источника, но в разные периоды времени. Часто практикуется сопоставление данных контент-анализа с данными социологических опросов, что позволяет меру совпадения, например, общественного мнения по определенному вопросу с точкой зрения газеты или позиции администрации, отраженной в приказе, инструкции, с позицией коллектива.
Контент-анализ определяется как метод качественно-количественного анализа массивов документов с целью получения достоверной информации об объективной реальности. Процедура контент-анализа состоит в алгоритмизированном (т.е. по определенным правилам) выделении в тексте интересующих исследователя элементов содержания, классификации выделенных элементов в соответствии с концептуальной схемой, последующем их подсчете и количественном представлении результатов.
Контент-аналитическое исследование начинается с определения эмпирических объектов, формирования репрезентативной выборки. ГС, подлежащую исследованию, представляет массив вербальных, фонетических или иконографических документов, объединенных общим признаком (источник, автор, тема, цель создания и т.п.). Границы ГС задаются достаточно произвольно: исходя из целей исследования и с учетом естественных временных циклов (год, квартал, месяц), а также периодичности изданий (если речь идет об анализе содержания СМИ). Например, в исследовании динамики освещения в республиканской прессе проблем, связанных с аварией на Чернобыльской АЭС, ГС документов были все газеты, изданные в республике с конца апреля 1986 года (т.е. с момента аварии). Если стоит задача провести контент-анализ кампании по выборам президента, то в границы ГС будут включены все документы, опубликованные в связи с выборами с момента начала кампании до момента ее завершения.
При формировании выборочной совокупности документов из трех возможных стратегий: сплошного, случайного, направленного отбора ― используются только две первые. Направленный тип отбора исключается, т.к. отсутствуют данные о распределении признаков в ГС документов. Чаще всего в контент-анализе используется многоступенчатый отбор. На первой ступени отбираются источники. В том случае, если источников много, они предварительно группируются, и отбор производится из каждой группы. На второй ступени отбираются собственно тексты документов ― протоколы собраний, инструкции, листовки, письма, фильмы, передачи, материалы газет внутри каждого из выделенных на первой ступени источника. Отбор газет представляет собой разновидность гнездовой выборки (гнездо ― номер газеты). Выделение гнезд ― номеров газеты ― методом систематического отбора нежелательно, т.к. учитывая периодичность выхода газет, можно получить смещенную выборку, в которую попадут только, например, номера за понедельник или за вторник, или за пятницу, в то время как номера за другие дни недели вообще выпадут из поля зрения. Целесообразно осуществлять формирование выборочной совокупности по принципу наполнения [86. 155]. В соответствии с этим принципом выбор единиц наблюдения прекращается тогда, когда ошибка выборки удовлетворяет исследователя. Для этого необходимо процесс отбора контролировать, периодически замеряя ошибку. Ссылаясь на опыт, Н.Н.Чурилов, описавший этот метод, отмечает, что предельная теоретическая ошибка выборки стремительно уменьшается при анализе первых 10 ― 15 газет. Если же и дальше продолжать увеличивать число единиц наблюдения, то ошибка уменьшается незначительно. Порогом насыщения является совокупность в 30 ― 35 газет. []
Обозначив выборочную совокупность текстов, подлежащих исследованию, социолог приступает к разработке таблицы контент-анализа. Первое, что ему необходимо, ― определить категории анализа, т.е. наиболее общие ключевые понятия, отражающие понятийную систему исследования в целом. Выполняя эту работу, социолог ориентируется на концепцию исследования, сформулированную в его программе. Покажем это на примере контент-аналитического исследования должностных инструкций [46. 138 ― 150]. Инструктивные предпиcания рассматриваются автором как важнейший фактор, влияющий на координацию межличностных взаимодействий работников в рамках трудового коллектива. По мысли автора, от того, насколько четко и подробно в инструкции регламентированы цели деятельности, средства, применяемые для их достижения, способы реализации целей того или иного должностного лица, в конечном счете зависят успехи или неуспехи производственного коллектива. Социолог выделяет шесть категорий анализа, соответствующих шести аспектам регламентации. Они включают: 1 ― место должности в структуре организации, 2 ― цели деятельности данного должностного лица, 3 ― наобходимые квалификационные требования, 4 ― обязанности, 5 ― подчиненность и права должностного лица, 6 ― ответственность.
Другой пример касается отражения молодежными СМИ проблем формирования гражданского общества в РБ. Операционально гражданское общество можно представить как совокупность сбалансированных, прозрачных и саморегулирующихся связей и отношений самодеятельно активных субъектов по вертикали и по горизонтали (т.е. с государством и между собой). Описание социальных взаимодействий по вертикали и по горизонтали, характеристика их сбалансированности, а также характеристика инструментов и способов осуществления этих взаимодействий дают представление о степени приближенности описанной в СМИ социальной реальности к стандартам гражданского общества. В соответствии с концептуальной схемой были выделены категории контент-анализа: субъекты взаимодействия (индивиды, группы, организации), направленность взаимодействия (по горизонтали и по вертикали), цели субъектов (конструктивные либо деструктивные), характер взаимодействия (конфликт, компромисс, партнерство), результаты взаимодействия (мера достижения цели), инструменты взаимодействия (политические, экономические, правовые, коммуникационные).
Категории выделены. Следующий шаг ― их структурирование. Эта операция предполагает деление общего понятия на более частные понятия (подкатегории) в соответствии с выбранными классификационными признаками. Важно, чтобы при разработке системы подкатегорий контент-аналитик соблюдал правила деления объема понятия: а) одно и то же деление понятия должно осуществляться по одному и тому же основанию; б) объем членов деления, вместе взятых, должен равняться объему делимого понятия; в) члены деления должны взаимно исключать друг друга; г) деление должно быть непрерывным. Например, категория “Необходимые квалификационные требования” конкретизирована с помощью следующих подкатегорий: “необходимый уровень образования”, “знания и умение работника”, “документы, которыми должен руководствоваться работник”. Каждая из подкатегорий при необходимости может структурироваться и далее (при соблюдении принципа непрерывности деления). Категории анализа жестко заданы проблемой исследования, его концепцией, тогда как подкатегории, как правило, вариативны, гибко приспособлены к тому материалу, который предстоит анализировать, и к тем задачам, которые предстоит решить.
Для разработки “категориальной сетки”, т.е. системы категорий и подкатегорий анализа в ОСИ практикуется привлечение экспертной группы. Специалисты-эксперты, по опыту работы знающие объект исследования и поставленную проблему, совместно с социологами могут более точно и оперативно выделить наиболее существенные понятия, с помощью которых описывается объект, и правильно структурировать их. Например, очень часто при структурировании такой постоянно используемой категории, как “тема сообщений в СМИ”, возникает вопрос, каким должен быть полный, исчерпывающий список освещаемых тем. Трудность состоит в том, что, с одной стороны, не существует четкого логического критерия для создания тематической шкалы, а с другой ― нет универсальной для всех СМИ тематики – она, как правило, варьирует от одного информационного источника к другому. На вопрос о том, какой список тем адекватен данному источнику, лучше всего ответят эксперты. Другой пример. Если задачей социолога является анализ документов за длительный период времени, например, за несколько лет, для определения динамики содержания информационного источника бывает необходимо выделить периоды не по формальным, а по содержательным критериям. В контент-аналитическом исследовании, посвященном имиджу политического лидера в белорусских СМИ и его динамике с 1994г. по 1997г., периоды определяли политологи и журналисты, учитывая проводившиеся в то время выборы, предвыборные кампании, подготовку референдума и т.д.
Полученную схему, состоящую из категорий и подкатегорий, далее необходимо сопоставить с конкретным текстом или, иными словами, найти для всех категорий и подкатегорий адекватное выражение на языке исследуемых документов. Таким их выражением являются единицы анализа. Если сопоставить категории (подкатегории) и единицы анализа, то можно сказать, что последние являются результатом операционализации первых. Например, категория “география сообщений по РБ” операционализирована так: “слова, обозначающие названия городов и других населенных пунктов РБ и соотносимых с ними регионов, типа Витебская область, Борисовский район”. Категория “оценка” ― “оценочные суждения, выражающие положительное либо отрицательное отношение к объекту высказывания” и т.д.
В практике сложился целый ряд устойчивых стандартных единиц контент-анализа. К их числу относятся следующие:
Отдельное слово. Например, имена политических деятелей и институтов, названия стран, слова, обозначающие политические акты и состояния (война, революция), идеологии (коммунизм, либерализм), экономическую реформу и экономические процессы (приватизация, акционирование, демонополизация). Выбирая слово в качестве единицы анализа, необходимо иметь в виду явление синонимии.
Суждение ― законченная мысль, логическая цепь, в которой обнаруживается центральная идея. Примеры подобных смысловых единиц анализа: описание брака или любви между двумя конкретными людьми, истории их взаимоотношений и всех сопутствующих обстоятельств [64, 97]; экологическая проблемная ситуация ― часть текста, содержащая информацию об определенном аспекте отношений человека со средой, оценке этих отношений и о связанных с ним объяснениях [64, 97; 35, 245].
Персонаж("герой") сообщения. Используется при изучении пропаганды профессий [30, 1986], интерпретации особенностей того или иного национального характера в СМИ, в других контент-аналитических исследованиях, когда необходимо определить, какие качества приписываются личности (группе) в интересующих аналитика документах [30; 13, 57 ― 90 ].
Из приведенного описания следует, что фрагменты текста, соответствующие различным единицам анализа, могут колебаться от минимального размера (слово) до максимального (логическая цепь, жизненная ситуация), которые фиксируются в пределах целого сообщения или даже нескольких сообщений. Единицы анализа с наибольшей точностью идентифицируются на фоне более широких содержательных структур, которые иногда называют единицами контекста. Для слова и предложения контекстом будет абзац, для жизненной ситуации или проблемной ситуации ― целое сообщение.
В ОСИ, одним из основных требований которого является оперативность, важно использовать простые, четкие, хорошо идентифицируемые единицы анализа. В том случае, когда единица анализа по определению сложная и ее не так просто идентифицировать в тексте документа, прибегают к помощи экспертов. Например, при анализе фонетических документов (радио- или телепередач), когда нет возможности сразу четко уловить характеристику содержания или вернуться к тексту еще раз, документ прослушивают несколько экспертов и выносят свое суждение о наличии либо отсутствии признаков тех или иных категорий в тексте.
Обнаружение единиц анализа в тексте документа сопровождается процедурой их измерения с целью определить объем внимания или частоту обращения к тем или иным проблемам, символам, темам, героям. При выявлении объема внимания вычисляется количество строк, минут эфирного времени или размер газетной, журнальной площади, посвященной интересующей нас единице анализа. В случае, если необходимо определить частоту обращения, подсчитывается количество упоминаний соответствующего символа, общее число упоминаний слов, предложений, суждений или количество абзацев, других фрагментов текста, содержащих данную единицу. Если единицей анализа выступает признак, характеризующий сообщение в целом, фиксируется просто его наличие в тексте и подсчитывается количество материалов, содержащих этот признак. Таким признаком может быть, например, авторство материала: подытоживается количество сообщений, чьи авторы профессиональные журналисты, политики, ученые, специалисты и т.д.
Идентифицируя элементы содержания и классифицируя их в соответствии с категориями и подкатегориями, контент-аналитик должен соблюдать принцип объективности. Принцип объективности, который обозначает независимость идентификации элементов содержания и последующей их классификации от субъективного мнения аналитика. Объективность достигается при условии такого точного и однозначного определения категорий и единиц анализа, чтобы приложив их к одинаковому содержанию, разные аналитики получили бы и одинаковый результат.
Наибольшая объективность достигается при компьютерном контент-анализе (первые программы для анализа текстов на ЭВМ были разработаны в 60 г.г. в Масачусетском технологическом институте под руководством Ф.Стоуна). В этом случае идентификация элементов содержания осуществляется по чисто формальным критериям.
В ручном варианте иногда трудно избежать определенной субъективности в процессе выделения единиц анализа и их соотнесения с категориями. Поэтому существуют способы контроля надежности контент-аналитической методики, которые следует использовать в процессе работы над документами. Например, один и тот же документ анализируется по единой инструкции разными кодировщиками. Если расхождение между данными кодировщиков не превышает 5%, то можно считать, что методика позволяет получать устойчивые результаты, категории и единицы анализа, а также алгоритм кодирования описаны достаточно точно и однозначно. При этом не обязательно нескольким кодировщикам анализировать все документы, достаточно взять для пробы какую-то часть выборки или повторить процедуру параллельного кодирования и сопоставления результатов в ходе анализа через определенный шаг.
Однако изучаемое содержание не в одинаковой степени поддается формализации. Не всегда задачи исследования дают возможность выработать такие строгие формальные предписания, руководствуясь которыми разные кодировщики выносили бы одинаковые решения (в случае когда единицы анализа представляют собой сложные конструкции: жизненная ситуация, модель постановки и решения проблемы и т.п.). Тогда работа кодировщика из механической превращается в аналитическую.
Объективность и надежность получаемых результатов в таких исследованиях обеспечивается тщательным отбором и подготовкой кодировщиков, параллельным кодированием одних и тех же текстов. Кроме того, практикуется обсуждение каждого из проанализированных документов и вынесение согласованного решения в случае несовпадения мнений кодировщиков.
Другой важный принцип, которому должен следовать контент-аналитик, ― принцип систематичности. Он подразумевает, что все без исключения документы, попавшие в выборку, все исследуемое содержание должно быть проанализировано по единой методике. Не допускается частичный анализ, произвольное исключение из поля зрения тех или иных текстов, а также их анализ лишь по некоторым, выборочным, категориям.
Следует упомянуть еще один, третий, принцип контент-аналитического исследования ― обобщенность. Его смысл состоит в том, что главная цель изучения текста ― получение информации о внетекстовой реальности. Есть три возможности сопоставления текста с внетекстовой реальностью, три вектора движения от документа к отражаемым в нем объектам: событиям, фактам, явлениям реальной действительности; создателю текста, коммуникатору; получателю информации, аудитории. Корректное сопоставление текста и внетекстовой реальности, установление зависимости между целями создателя текста и его содержанием требует оперирования сравнимыми данными. Поэтому в рамках ОСИ контент-анализ зачастую выступает в комплексе с другими методами: опросом, наблюдением, экспериментом.
Приступая к контент-анализу, социолог должен иметь следующие документы: таблицу контент-анализа, инструкцию кодировщика, кодировальную карточку. Таблица контент-анализа содержит список категорий и подкатегорий и присвоенные им коды, инструкция кодировщика ― описание единицы анализа и счета (в ней изложены правила кодирования, проиллюстрированные соответствующими примерами, оговориваются возможные затруднения и спорные моменты).
Осваивая инструкцию, кодировщик (тот, кто выполняет работу по сбору эмпирической информации, фиксируя, классифицируя и подсчитывая единицы анализа) овладевает алгоритмом действий, что в конечном счете и обеспечивает реализацию принципа объективности, когда различные аналитики, приложив методику к одному и тому же содержанию, получают один и тот же результат.
Регистрация единиц анализа производится в специальных таблицах, кодировочных матрицах или карточках. Кодировочная карточка, например, включает все классификационные единицы ― категории и подкатегории. Единицы анализа, обнаруженные в документе, по ходу работы фиксируются в соответствующих графах . Для количественного описания результатов анализа содержания используются те же средства и приемы, что и в любых других социологических исследованиях: процентное распределение, индексы, парные корреляции, различные виды многомерного статистического анализа. Приведем пример.
Единицей анализа в ОСИ выступает понятие.
Дата добавления: 2015-09-11; просмотров: 2837;