ПРИЕМЫ КАЧЕСТВЕННО-КОЛИЧЕСТВЕННОГО АНАЛИЗА ДОКУМЕНТОВ
Основная трудность при работе с доступными (т.е. не целевыми) документами — умение читать данные на языке гипотез исследования. Ведь документ был составлен вовсе не для того, чтобы проверить гипотезы социолога. Поэтому, прежде чем анализировать документальные материалы по существу, социолог вынужден проделать утомительную работу поиска в документе индикаторов (признаков) ключевых понятий исследования.
Когда В.И. Ленин обратился к данным земской статистики, ему пришлось начать с группировки исходных сведений в иных терминах. Статистика предлагала цифры о посевных площадях, численности рабочих лошадей у крестьян, о пудах товарного зерна и тп. Ленину же для исследования процессов расслоения крестьянства и развития капитализма в России нужно было соотнести эти сведения с содержанием понятий "бедняк", "середняк", "кулак". Дело осложнялось еще тем, что данные по разным губерниям были представлены в различных единицах, так что первоначально В.И. Ленин сводил все материалы в однозначные показатели, а затем группировал их согласно исходным предпосылкам.
Качественный анализ документов — необходимое условие для всех количественных операций. Но прежде следует заметить, что квантификация текстов далеко не всегда целесообразна.
В каких случаях не следует прибегать к количественному анализу? Видимо, это неразумно, если мы имеем дело с уникальными документами, где главная цель изучения — всесторонняя содержательная интерпретация материала. Не следует обращаться к количественному анализу, если перед нами описания весьма сложных явлений, если документальных данных недостаточно для массовой обработки или они неполные (нерепрезентативны).
Когда количественный анализ текстов уместен? Прежде всего, отмечает один из основателей этого метода — Б. Берельсон [306], - если требуется высокая степень точности при сопоставлении однопорядковых данных. Далее, когда достаточно много материала, чтобы оправдать усилия, связанные с его количественной обработкой, и если этот материал репрезентирует области изучения. Квантификация необходима, когда текстового материала не только достаточно, но столь много, что его нельзя охватить без суммарных оценок. Квантификация возможна при условии, что изучаемые качественные характеристики появляются с достаточной частотой.
Наиболее целесообразно использовать количественный анализ, если квантифицированные тексты сопоставляются с иными, также количественными характеристиками. Например, выраженные в статистических распределениях особенности содержания газетных сообщений сопоставляются с численностью подписчиков, их мнениями об этих материалах, тоже выраженными в числах.
Квантификация текстового материала получила весьма широкое распространение, и в 40-х годах для нее была разработана специальная процедура, названная "контент-анализ".
Контент-анализ — это перевод в количественные показатели массовой текстовой (или записанной на пленку) информации с последующей статистической ее обработкой. Его основные операции были разработаны американскими социологами X. Лассуэллом и Б. Берельсоном [309, 296]б. Важный вклад в разработку процедур контент-анализа внесли советские социологи, особенно А.Н. Алексеев, Ю. Вооглайд, П. Вихалемм, Б.А. Грушин, Т.М. Дридзе, М. Лауристинь.
Основные процедуры контент-анализа. Контент-анализ начинается с выявления смысловых единиц, в качестве которых используют:
(а) Понятия, выраженные в словах и отдельных терминах. Это могут быть понятия из области экономики: интенсификация, технический прогресс, методы хозяйствования, оптимизация управления и др.; термины политического содержания: интернационализм, демократия, разрядка, мирное сосуществование, перестройка; нравственные или правовые символы: почин, активность, инициативность, деловая предприимчивость, нарушение законности, несоблюдение дисциплины; научные: модель, система, космическое пространство и т.п. Очевидно, что анализ текста по содержанию понятий несет немало важной социальной информации. Например, по частоте употребления понятий, связанных с наукой и новой техникой, можно определить, в какой мере источник информации ориентирован на реализацию программы ускорения научно-технического прогресса.
(б) Тема, выраженная в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.
По тематике можно еще более полно представить содержание документа. Темы развертывания инициативы, борьбы с бюрократизмом, распространения передового опыта или соблюдения социальной справедливости, соблюдения норм социалистического образа жизни как темы массовых коммуникаций очень показательны. Столь же показательны сюжеты из личных документов, например писем о самом себе или о своих близких, о делах производственных и политике, об искусстве и т.п. Все это — свидетельства определенной направленности взглядов, интересов, ценностных ориентации и норм деятельности.
(в) Имена исторических личностей, политиков, выдающихся ученых и деятелей искусства, передовиков производства.
Эти характеристики могут свидетельствовать о влиянии отдельных лиц или представляемых ими организаций на общественное мнение. По числу ссылок на отдельных авторов определяют значимость той или иной научной идеи: если число ссылок растет или падает, это свидетельствует о росте или падении авторитета данной концепции.
В эту же группу можно включить упоминания организаций, учреждений или иных общественных институтов.
(г) Целостное общественное событие, официальный документ, факт, произведение, случай и т.п. несут специфическую смысловую нагрузку и тоже могут быть приняты за единицы анализа. Частота и длительность (во времени) упоминания общественного события или государственного решения (например, борьба за трезвый образ жизни) — свидетельство его важности для общества.
Эстонский социолог М.Лауристинь следующим образом обобщает задачи, объект и предмет контент-анализа применительно к изучению массовых коммуникаций [129]: (1) проблематика отражения действительности; (2) область реализации целей коммуникатора и социального института, который он представляет; (3) сфера потребностей аудитории массовой коммуникации, удовлетворяемых ею; (4) область взаимодействия коммуникатора (органа информации, пропагандиста...) и аудитории. Далее развертывается система индикаторов применительно к каждому из названных аспектов. Например, для первого аспекта (отражение реальности) ставятся задачи: (а) реконструировать события и явления (б) и установить закономерности отображения действительности средствами массовой коммуникации. Объектом анализа здесь выступают — содержание сообщений, их тематика и смысловые значения, а предметом — картина мира, представляемая средствами массовой информации. В последнем аспекте (взаимодействие) ставятся задачи прогнозировать эффективность информационного воздействия, его социальный эффект и коммуникативные отношения между различными группами аудитории. Как объект коммуникации здесь указываются язык и структура текста (то, о чем сообщается) и характеристики источника сообщения, а также его адресата. Предмет анализа в этом случае — соответствие средств коммуникации ее целями опыту аудитории, содержания сообщений — социальному опыту слушателей и зрителей и, наконец, соответствие коммуникативных отношений между группами населения, как они отображаются в сообщениях, реальным отношениям, как они есть в действительности.
Контент-анализ текстов может быть применен в самых разных областях исследования. Одним из примеров его использования в педагогических науках является интересная работа ленинградских социопедагогов [47]. Они применили данный способ для изучения доходчивости нравственной пропаганды в школах. Ученикам 9—10-х классов дневной и вечерней школ было предложено определить смысл 15 нравственных понятий: культура, труд, просвещение, религия, нравственность, долг, образование, предрассудки, мораль, искусство, творчество, честь, знания, пережитки, красота. Смысловые единицы анализа были представлены в упорядоченной номинальной шкале: (а) неудовлетворительное осмысление предмета (ответы типа "не знаю", предложение логического "круга", тавтология), дальше — (б) пояснение смысла путем простого перечисления примеров, скажем "искусство - это музыка, живопись, литература", (в) указание на существенное свойство предмета, но неполное его осмысление, например "честь — это собственное достоинство", (г) максимально полное смысловое определение.
В итоге были получены крайне важные для совершенствования педагогической работы данные, указывающие на особенности восприятия моральных категорий учащимися разного возраста и с разным жизненным опытом.
Итак, смысловые единицы анализа выделяются на основе содержания гипотез исследования, подсказываются методологическими посылками программы.
Например, в нашем исследовании сравнивалось действие внешних и внутренних факторов, определяющих степень самостоятельности в производственной деятельности инженера-проектировщика. Чтобы получить сведения о требованиях, предъявляемых к инженерам со стороны организации, мы взяли для контент-анализа характеристики, представляемые на каждого сотрудника в период прохождения им государственной аттестации.
Единицей анализа в характеристике, согласно цели и задачам исследования
должны быть суждения, касающиеся требования "быть самостоятельным в работе". Индикаторы этих требований отыскиваются в текстах характеристик (схема 17).
Мерой выражения признака "требование самостоятельности" может быть, например, отношение частоты упоминания в характеристике качеств инициативы и знаний, вместе взятых, против исполнительности и аккуратности. Чем чаще упоминается в характеристиках требование исполнительности и чем реже — требование знаний, инициативы и творчества, тем выше абсолютное значение "индекса несамостоятельности".
Единицы счета могут и совпадать и не совпадать с единицами анализа. В первом случае квантификация сводится к определению частот упоминания выделенной смысловой единицы по отношению к другим категориям (как в случае построения индекса самостоятельности инженеров).
Во втором случае единицей счета избирают физическую протяженность или площадь текстов, заполненную смысловыми единицами: число строк, абзацев, квадратных миллиметров, знаков, колонок —в печатных текстах; длительность трансляции по радио или телевидению, метраж пленки при магнитофонных записях.
Контент-анализ текста может быть весьма многосторонним, причем одновременно используется несколько единиц анализа и несколько единиц счета.
В исследовании Б.А. Грушина для определения фактического использования населением источников информации сначала с помощью контент-анализа фиксировалось все "поле" сообщений, передаваемых через газеты и другие каналы массовой информации, а затем — "поле" массового сознания, т.е. уровень информированности населения по проблемам, выявленным путем анализа текстов.
Рассмотрим, как, например, фиксировалось содержание информации по проблемам международной жизни (центральные и местные газеты)- [106, с. 41-56].
По каждой зарубежной стране материалы рассматриваются с точки зрения (а) частоты информации, (б) объема, (в) содержания, (г) знака информации и (д) типа материалов.
(а) Частота информации определяется как частота упоминания данной страны или проблемы, указанных в разделе "в", частота положительных-отрицательных оценок (раздел "г") и частота описательно-оценочной информации (раздел "д").
(б) Объем информации фиксируется двумя единицами: по числу строк текста и по удельному весу информации о данной стране в общем объеме газетного текста.
(в) Содержание сообщений о данной стране группируется в таких, например, смысловых единицах, как сообщения, касающиеся промышленности, сельского хозяйства... политического и общественного устройства ...природных условий... быта и нравов... освободительной борьбы... внутриполитических акций... отношения к СССР и т.д. (всего 28 категорий).
(г) Знак информации определяется как "положительное" — "отрицательное", "сбалансированное" и "нейтральное" отношения, что соответственно кодируется как +, -, ±, 0.
(д) Тип или характер информации: 1. Фактографическая, содержащая сведения, полученные из неопределенного источника (источник не указывается); 2. Комментаторская: оценка фактов, свидетелем которых был автор сообщения; 3. Комментаторская: оценки фактов, свидетели которых не указываются; 4. Художественно-фактографическая: типа очерков, зарисовок "с натуры" с участием автора или с указанием источника; 5. Художественно-фактографическая: типа безадресных очерков с упоминанием событий, реальность которых сомнительна; 6. Общетеоретическая информация иностранных авторов, не содержащая ссылок на конкретные факты; 7. Аналогичная предыдущей - советских авторов; 8. Абстрактно-художественная: безадресные стихи, рассказы и т.п. иностранных авторов; 9. Та же советских авторов.
Далее по каждому из этих пунктов разрабатывается подробная инструкция с указанием правил отнесения материалов в рубрику по индикаторам газетного текста. Например, при определении знака информации инструкция требует от кодировщика определять знак "не на основе собственных впечатлений от текста (тем более не на основе привычных традиционных для средств массовой коммуникации способов освещения того или иного вопроса), но исключительно на основе видимым образом (в лексике текста) выраженного отношения коммуникатора к проблеме". Дается инструкция по тематике и "знаку" информации, например о позиции в вопросах войны и мира. Кодировать "+": "...Борется за сохранение мира на земле..."; кодировать "±": "...Занимает в вопросах войны и мира нейтралистскую позицию..."; кодировать "-": "...Создает обстановку военного напряжения".
Закодированный по детальной инструкции текст заносится в шифровальный лист и далее подвергается статистической обработке.
Надежность информации, получаемой контент-анализом, обеспечивается следующими способами,
а) Обоснование полноты объема выделяемых смысловых единиц, предложенное В.Н. Каюровой, может быть доказано следующим образом. Первоначально выделяются все смысловые единицы из первого анализируемого текста, далее из второго текста - те же плюс дополнительные, ранее не встречавшиеся, из третьего документа — опять те же, что уже встречались в двух предыдущих, плюс дополнительные и т.д. После изучения очередных 3—5 текстов, в которых уже не попадается ни одной новой единицы, ранее фиксированной в предыдущих документах, можно полагать, что "поле" смысловых единиц из изучаемого массива исчерпано.
Из рис. 10 видно, что в итоге изучения 20 случайно отобранных из всего массива текстов было выделено суммарно 120 единиц контент-анализа, что исчерпывает "поле", т.е. всю выборочную совокупность документов. Конечно, при изучении всего массива могут попасться новые смысловые единицы, относящиеся к предмету и ранее не предусмотренные. В этом случае они включаются в анализ дополнительно.
б) Контроль на обоснованность содержания смысловых единиц с помощью судей. Специалисты в данной области обсуждают, насколько предложенные качественные единицы соответствуют поставленным задачам.
В нашем исследовании 6 экспертов независимо друг от друга классифицировали 120 понятий, отнесенных к деловым и личностным качествам инженера, в 6 общих категорий (творческие качества, исполнительские и т.д.), причем 86% понятий были классифицированы однозначно минимум четырьмя судьями. Остальные, более спорные, подвергались специальному обсуждению и после согласованного решения относились в соответствующую общую категорию.
в) Обоснованность по независимому критерию. Например, данные контент-анализа дневников или сочинений учащихся с целью выявить их профессиональную склонность выборочно проверяются путем опросов, или по данным наблюдений, или тестом по известной группе.
г) Устойчивость данных определяется при помощи кодирования одного текста разными кодировщиками на основе единой инструкции. Можно использовать стабильную единицу анализа и разные единицы счета (по частотам смысловых единиц и по физической протяженности одновременно).
Процедуры подсчета. В общем виде процедуры подсчета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования и идеального изменения. Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного содержания. Можно предпринять перекрестную классификацию: (содержание выдвигаемых идей) X (средства, предложенные для их осуществления) X (аргументы).
По такой таблице целесообразно получить коэффициент энтропии распределения (Е) и коэффициент ассоциации (c2)- Мы увидим, в какой мере та или другая группа идей связана со специфической аргументацией и средствами реализации идеи.
Для исчисления результатов контент-анализа используются и специально разработанные формулы.
Так, А.Н. Алексеев предложил формулу оценки "удельного веса" смысловых категорий в общем объеме текста [153, с. 19—24]. Формула указывает на уровень интенсивности представления в тексте определенной темы (или аргументации, способов обращения к читателю и т.д.). Эта формула:
где Укс — "удельный вес" данной смысловой единицы;
Кгл — число случаев, когда смысловая единица оказалась главной; Квт - число случаев, когда та же единица оказывается второстепенной; å - сумма анализируемых текстов (документов).
Применяются также статистические расчеты доходчивости текста (терминов, предложений), его интересности для читателя и более сложные приемы изучения взаимосвязи распределений смысловых единиц [225, с. 60-67].
Техника контент-анализа находит все более широкое распространение в социальных исследованиях.
Большой эффективности при использовании контент-анализа добились эстонские социологи, работавшие в сотрудничестве с газетой "Эдази" в Тарту (руководитель исследований Юло Вооглайд). Содержание газеты подвергалось ежедневному контент-анализу по специальной программе, данные заносились на перфокарты, приспособленные для ручной обработки, и еженедельно обобщались на редакционных совещаниях. Результат — повышение оперативности обогащение содержания, удвоение тиража районной газеты за счет подписчиков по всей республике [51, 52, 48].
Применявшийся вначале для изучения эффективности массовой пропаганды, этот прием стал ныне сильным средством анализа всевозможных официальных и неофициальных документов, Контент-анализ применяют также в практике изучения писем, поступающих в различные организации и органы управления [108, с. 120—121], в социальной психологии и педагогике, в криминологии, искусствоведении, этнографии и т.д. [226, 114, 155, 217, 59]. Крайне трудоемкие процедуры обработки данных контент-анализа существенно облегчаются при использовании ЭВМ, что также немало способствует широкому распространению этой техники изучения документальных источников.
Дата добавления: 2016-08-07; просмотров: 907;