Процедуры подсчета при контент-анализе
В общем виде процедуры подсчета при контент-анализе аналогичны стандартным приемам классификации по выделенным группировкам, ранжирования и шкального измерения. Например, при изучении тематики газеты может быть произведено определение частотности сгруппированных смысловых единиц разного содержания.
Категории. В рамках концептуального контент-анализа в качестве категории, которая проводится через статистические процедуры, может выступать набор слов, объединенных по определенному основанию. Так, в случае использования категории ЭКОНОМИКА могут фиксироваться в едином списке такие слова, как экономика, безработица, инфляция. В категорию СЕМЬЯ могут входить слова - ребенок, семья, родители, мать, отец. Именно учет частот встречаемости категорий, а не отдельных слов, позволяет судить о внимании, уделенном в тексте тем или иным проблемам.
Очевидно, что от качества составления таких категорий во многом зависит качество результатов анализа.
Простые частоты. Наиболее рано в исследованиях с помощью контент-анализа стал использоваться просто подсчет частот появления в текстах различных понятий или тем.
Относительные частоты. Однако просто частота появления того или иного понятия или темы мало что говорят. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр.
Нормы.Относительные частоты позволяют сравнивать два и более текстов, но иногда требуется сделать вывод на основе анализа лишь одного текста. Например, имеется текст, в котором используется агрессивная лексика. Прежде всего, для решения вопроса о выраженности этой тематики должна быть составлена категория агрессивно окрашенной лексики. После этого надо оценить текст на основе относительной частоты употребления агрессивно окрашенных слов средним носителем того или иного языка (русского, английского и пр.), для чего следует использовать специальные частотные словари.
Связи категорий.Дальнейшее развитие контент-анализа требовало более тонких методов анализа текстов. К середине 1950-х годов исследователи стали все больше уделять внимания не простому наличию или отсутствию категорий в тексте, а связям между категориями. Для этого обращают внимание на совместную встречаемость слов различных категорий. Например, для каждого предложения текста можно выяснить, понятия из каких категорий в нем встречаются совместно. После этого легко подсчитать обычный коэффициент корреляции, который даст силу связи между категориями и знак этой связи. В результате может выявиться, что для некоторых категорий наблюдается тенденция их совместного употребления.
Контексты употребления слов.Можно отметить в тексте все предложения, в которые входит то или иное понятие, и составить статистику слов из этих предложений. В результате получится контекст употребления данного целевого понятия и выделятся существенные признаки, характеризующие соответствующий предмет, к которому относится целевое понятие.
Затем, выбрав предложения, в которых встречается конкретное понятие или тема, получается некоторая подвыборка текста, к которой применимы все методы контент-анализа: контексты употребления понятий и категорий, в свою очередь, могут быть проверены на основе простых частот, относительных частот, оценок категорий относительно нормы и т.д.
В целом, данная технология количественного анализа документов позволяет на основе формальных методов извлекать из массивов документов содержательную информацию.
Дата добавления: 2015-09-18; просмотров: 857;