Табличное представление данных
Социологу в ходе этих заключительных стадий необходимо постоянно помнить о том, что чаще всего те, кто будет читать ваш аналитический отчет, — отнюдь не профессиональные социологи. Значит, вам необходимо подумать о том, как наиболее наглядно и убедительно представить данные, полученные в результате обработки первичной социологической информации, чтобы более четко и емко изложить свои выводы, сформулированные в ходе анализа этих данных.
Позаботиться о том, какие таблицы вы будете строить, следует еще на этапе разработки программы исследования — не только при формулировке вопросов анкеты, но и при кодировке их, и в особенности — при разработке той части методического раздела программы, которая относится к логической схеме обработки и анализа данных. Возможно, следует заранее составить списки таблиц — как простых, так и комбинированных — с указанием расположения переменных по строкам и столбцам. Это упростит процедуру обработки данных, сделает ее более компактной во времени и более четкой по организации. Вероятно, несколько сложнее заранее предсказать, какие из графических изображений могут оказаться наиболее приемлемыми и значимыми, во многом это проявляется в ходе обработки. И, тем не менее, было бы целесообразно заранее составить предполагаемый перечень графиков, которые следовало бы построить и просмотреть (пусть даже мно-гие из них и не войдут в окончательный отчет), исходя из характера гипотез, сформулированных в программе. Это лишний раз подчеркивает важность подготовительного этапа — составления программы социологического исследования — и его влияния на окончательные результаты, эффективность, качество и успех этого серьезного и непростого дела.
Таблицы и графики в аналитическом отчете служат не просто иллюстративными материалами, а содержат в себе саму суть, ядро полученной в ходе исследования информации. Без них просто невозможно выразить в словесной форме выводы исследования, и текстовой материал превращается в простую словесную шелу-ху. У нас речь пойдет как о технике составления и обработки, редактирования таблиц и графиков, так и о некоторых областях их| применения.
Статистической называется таблица, которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным ло- гикой экономического анализа. Социологические таблицы, полу-чаемые после сбора и анализа первичных данных, относятся к числу статистических. Таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержа-ние всей таблицы (к какому месту и времени она относится), paс-полагается над ее макетом по центру и является внешним заго-ловком. Верхние заголовки характеризуют содержание граф (за-головки сказуемого), а боковые (заголовки подлежащего) - срок. Они являются внутренними заголовками.
Основные элементы статистической таблицы, представленные на рис. 5.1, составляют как бы ее основу.
Название таблицы* (общий заголовок) | ||||||
Содержание строк | Наименование граф (верхние заголовки) | |||||
А | ||||||
Наименование строк (боковые заголовки) | ||||||
Итоговая строка | Итоговая графа |
* Примечания к таблице.
Рис. 5.1. Основа статистической таблицы
Все группировки значений различных переменных, которые были предусмотрены программой исследования, ложатся в основу статистических таблиц, которые обобщают обработанную первичную социологическую информацию. Таблица3 — это перечень сведений, обычно числовых данных, приведенных в определенную систему и разнесенных по графам — строкам и столбцам. Внешне таблица представляет собой пересечение граф и строк, которые формируют ее состав. Каждое пересечение образует клетку таблицы. Размер таблицы определяется произведением числа строк на число граф. Цифровой материал может быть представлен абсолютными (численность населения РФ), относительными (индексы цен на продовольственные товары) и средними (среднемесячный доход служащего коммерческого банка) величинами. При необходимости таблица сопровождается примечанием, используемым с целью пояснения заголовков, методики расчета некоторых показателей, источников информации и т.д.
Строго говоря, процедура составления таблиц не представляет собой какой-то особой математической операции. Это скорее определенная форма отображения рядов распределений, полученных в результате расчетов. Основное преимущество этой формы заключается в том, что в ней кратко и емко даются пояснения значений соответствующих группировок. Хорошо сконструированная таблица позволяет как самому исследователю, так и заказчику более четко представить, описать и объяснить смысл и сущность изучаемого социального явления.
По логическому содержанию таблица представляет собой «статистическое предложение», основными элементами которого являются подлежащее и сказуемое.
Подлежащим таблицы называется объект, характеризующийся цифрами. Это могут быть одна или несколько совокупностей, отдельные единицы совокупностей (фирмы, объединения) в порядке их перечня или сгруппированные по каким-либо признакам (отдельные территориальные единицы или временные периоды в хронологических таблицах и т.д.). Обычно подлежащее таблицы дается в левой части, в наименовании строк. В социологической таблице подлежащим выступает конкретная переменная, которая подвергается анализу (рис. 5.1).
Сказуемое— система показателей, которыми характеризуется объект изучения, т.е. подлежащее (или то, что именно говорится в статистическом предложении о подлежащем). Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо4.
Заголовок — название таблицы, которое раскрывает структуру группировки описываемых переменных либо характер связи (зависимости) между двумя и более переменными. Наряду с этим в названии (или чаще в подзаголовке) иногда указываются общие для всех переменных единицы измерения (число ответов, проценты, средний балл и т.д.).
Все таблицы можно разделить на три вида: простые (линейные), групповые и комбинационные.
Простые таблицы представляют собою перечень (список) отдельных значений той или иной переменной с количественной или качественной характеристикой каждой из них в отдельности. Поэтому иногда их называют также перечневыми. Примером простой таблицы может служить распределение опрашиваемой совокупности по полу респондентов (табл. 5.1).
Таблица 5.1
Распределение респондентов по полу
Пол | Частота | Процент |
Мужчины | 46,1 | |
Женщины | 52,4 | |
Не указали | 1,6 | |
Всего | 100,0 |
Групповые таблицы обычно содержат группировку единиц совокупности по одному признаку, а комбинационные — по двум
и более признакам. В комбинационных таблицах, чтобы избежать излишней нагроможденное™ данных, затрудняющей их восприятие, иногда опускают абсолютные величины (частоты) тех или иных значений переменных, оставляя лишь пропорции или проценты. Примером комбинационной разработки статистической таблицы может служить табл. 5.2.
Таблица 5.2
Распределение рабочей молодежи по возрастам поступления на работу в
Москве и Московской области в 20-е гг.5 (в процентах к общей численности каждой половой группы)
Возраст(лет) | По губернии | По Москве | ||
юноши | девушки | юноши | девушки | |
до 12 | 7,4 | 3,8 | 12,0 | 4,7 |
13-15 | 48,1 | 43,7 | 59,2 | 56,5 |
16-18 | 44,5 | 52,5 | 28,8 | 38,8 |
Такая таблица являет собою уже нечто большее, нежели простой перечень данных. Она, с одной стороны, является как способом, так и результатом определенной организации, систематизации данных, а с другой — может стать удобным инструментом для анализа связей между тремя переменными — географическим положением, полом и возрастом.
Хорошо сконструированная таблица позволяет исследователю более четко представить и описать смысл и сущность изучаемого им социального явления.
Но что такое грамотно сконструированная таблица? Приведем основные правила построения статистических таблиц:
♦ таблица должна быть компактной и содержать только те исходные данные, которые прямо отражают исследуемое явление — либо в статике, либо в динамике;
♦ следует избегать ненужной, второстепенной, бессодержательной, не относящейся к данному объекту исследования информации;
♦ цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз;
♦ заголовок таблицы, а также названия граф и строк должны быть четкими, краткими, лаконичными;
♦ в заголовке должны быть отражены объект, признак, время и место совершения события;
♦ в социологических таблицах, отражающих результаты выборочного опроса, в заголовок выносится доля от числа опрошенных (в % к общему числу опрошенных, к общему числу ответивших и т.д.);
♦ заголовки таблицы, граф и строк пишутся полностью, без сокращений;
♦ для облегчения чтения таблицы необходимо избегать большого количества точек7 и запятых в названиях таблицы и граф;
♦ графы и строки в социологических таблицах не обязательно нумеровать;
♦ графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям; при этом используются общепринятые сокращения единиц измерения (чел., руб., кВт • ч и т.д.);
♦ информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой, обозначаемой: всего, итого;
♦ если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то им необходимо присвоить общий объединяющий заголовок;
♦ лучше всего располагать сопоставляемую в ходе анализа информацию в соседних графах (либо одну под другой), что облегчает процесс ее сравнения;
♦ для удобства чтения и работы числа в таблице следует проставлять в середине граф;
♦ числа целесообразно округлять с одинаковой степенью точности (до целого знака, до десятой доли);
♦ отсутствие данных в разных случаях обозначается по-разному: а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак; «X»; б) когда по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «Нет свед.», или «Н. св.»; в) при отсутствии явления ставится знак — (прочерк);
♦ в случае необходимости дополнительной информации, разъясняющей отдельные позиции в таблице, к ней даются специальные примечания (о сущности или ограничении сферы распространения данного показателя, применяемой методологии, используемых источниках и т.д.).
Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально-экономических явлений.
Прежде чем перейти к методическим рекомендациям по созданию и редактированию таблиц, необходимо обратить внимание на некоторые важные моменты, связанные с их конструированием. Прежде всего, следует отметить, что наиболее рациональным было бы продумать конструкцию таблиц на стадии разработки методического раздела программы социологического исследования, а именно той его части, которая называется «Логическая схема обработки и анализа данных». В этой части фактически и задается конструкция и формат таблиц. Обычно не возникает особых сложностей с конструкцией таблиц простых (линейных) распределений. Что же касается комбинационных таблиц, то здесь хотелось бы дать некоторые методические рекомендации, исходя из практического опыта проведения исследований.
Большинство комбинационных таблиц при расчетах в программе SPSS формируется в ходе операции, именуемой кросста-буляция. Получаемые в результате кросстабы должны быть, как и любые другие таблицы, наглядны, обозримы и, по возможности, размещаться в пределах одной страницы. Поэтому первая рекомендация состоит в следующем: так как ориентация текста на странице в абсолютном большинстве случаев бывает «книжная», а не «альбомная» (т.е. страница больше по высоте, чем по ширине), нужно обращать внимание на соотношение числа значений (вариантов) тех переменных, связь между которыми будет отражена в кросстабе. При этом мы советуем руководствоваться простым правилом: ту переменную, которая имеет больше возможных значений, лучше размещать по строкам, а ту, у которой значений меньше, — по столбцам. Попытаемся показать это на конкретном примере.
По результатам опроса, проведенного студентами НКИ в Нижнем Новгороде в декабре 2001 г. и посвященного изучению оценок ситуации, сложившейся в течение первых 100 дней после выборов нового губернатора, мы решили выявить связь между возрастом избирателей и уровнем их электоральной активности (по факту реального участия во втором туре выборов губернатора). Для этого мы производим кросстабуляцию («перекрестное» наложение распределений ответов на вопросы о возрасте и об участии в выборах). Переменная «участие», согласно анкете, имела 3 значения (да, нет, не помню); переменная «возраст» — 5 значений 226
(до 30 лет; 30—39 лет; 40—49 лет; 50—59 лет; 60 лет и старше). Таким образом, таблица может иметь два различных вида в зависимости от расположения переменных. Если мы разместим по строкам переменную «участие», а по столбцам переменную «возраст», то таблица будет иметь 3 строки и 5 столбцов; а если точнее, то 6 строк и 8 столбцов (6x8), поскольку нужно добавить и по строкам, и по столбцам, во-первых, размещение сказуемых, во-вторых, варианты «не дали ответа», в-третьих, суммы. Если же мы поступим наоборот, т.е. разместим по строкам переменную «возраст», а по столбцам переменную «участие», то таблица будет иметь 7 строк и 5 столбцов (7x5). Реально эти два варианта размещения будут выглядеть так, как показано в табл. 5.3а и 5.36.
Таблица 5.3а
Зависимость | участия в | выборах от возраста | |||||
Участие в выборах | Возраст | Всего | |||||
Нетответа | до 30 лет | 30—39 лет | 40—49 лет | 50-59 лет | 60 лет и старше | ||
Нет ответа | |||||||
Процент | 36,4 | 0,6 | 1,0 | 1,0 | 1,0 | ||
Да | |||||||
Процент | 36,4 | 50,4 | 60,4 | 60,5 | 81,0 | 72,0 | 60,4 |
Нет | |||||||
Процент | 18,2 | 47,0 | 34,9 | 37,4 | 15,5 | 27,0 | 36,2 |
Не помнят | |||||||
Процент | 9,1 | 2,7 | 4,1 | 1,0 | 3,6 | 2,4 | |
Всего | |||||||
Процент | 100,0 | 100,0 | 100,0 | 100,0 | 100,0 | 100,0 | 100,0 |
Вообще характер размещения переменных по строкам или столг бцам особо принципиального значения не имеет, однако нам кажет-ся, что второй вариант предпочтительнее в силу своей компактнос-ти и лучшей обозримости. Хотя, конечно, во многом это дело вку-са, и преимущества второго варианта становятся более очевидны, когда одна из переменных имеет достаточно большое число возмож-ных значений. Однако для дальнейшего анализа необходимо принять во внимание еще одно правило: внимательно отслеживайте, где вы размещаете независимую переменную, и соответственно этому зада-вайте команду на расчет процентов в кросстабе.
Напомним процедуру расчетов в SPSS. Учитывая, что в табл. 5.3а независимая переменная — в данном случае возраст — размещается по столбцам, при расчете кросстабуляции в программе SPSS мы, перед тем как нажать клавишу <ОК>, вошли в диалоговое окно
Options и там задействовали опцию Column percentage(Процент по столбцам), затем, нажав клавишу <Continue>, вернулись в окно Crosstabs и лишь после этого нажали клавишу <ОК>. Соответственно, поскольку в табл. 5.36 независимая переменная размещается по строкам, мы выбирали опцию Row percentage(Процент по строкам).
Таблица 5.369
Зависимость участия в выборах от возраста
Возраст | Участие в выборах | Всего | |||
Нет ответа | Да | Нет | Не помнят | ||
Нет ответа | |||||
Процент | 36,4 | 36,4 | 18,2 | 9,1 | 1,3 |
До 30 лет | |||||
Процент | 50,4 | 47,0 | 2,7 | 32,1 | |
30—39 лет | |||||
Процент | 0,6 | 60,4 | 34,9 | 4,1 | 20,5 |
40—49 лет | |||||
Процент | 1,0 | 60,5 | 37,4 | 1,0 | 23,7 |
50—59 лет | |||||
Процент | 81,0 | 15,5 | 3,6 | 10,2 | |
60 лет и старше | |||||
Процент | 1,0 | 72,0 | 27,0 | 12,2 | |
Всего | |||||
Процент | 1,0 | 60,4 | 36,2 | 2,4 | 100,0 |
5.2. Техника редактирования таблиц10
Существует целый ряд особенностей редактирования данных, полученных при расчетах с помощью пакета SPSS, в программе текстового редактора Microsoft Word. Дело в том, что результаты своих расчетов пакет SPSS выдает в формате MS-DOS. Получен-* ный в SPSS файл накопления полученных результатов расчетов (возникающий в окне под названием Output") сохраняется с расширением (.1st) — для версии 6.012 или (.Us) — для версии 4.0. Поэтому перед тем как открыть его из программы Word, необходи-228
мо в окошке «Тип файлов» выбрать вариант «все файлы», иначе в перечне файлов он просто не отразится. После того как, выбрав нужный файл, вы нажмете клавишу «открыть», программа Word сделает запрос относительно того формата, в который необходимо преобразовать этот файл. В диалоговом окне «Преобразование файла» следует выбрать вариант «Текст DOS».
Приведем пример процедур (с указанием последовательности операций) редактирования конкретных таблиц. В упоминавшемся выше опросе по поводу изучения тех оценок, которые дают нижегородцы сложившейся послевыборной ситуации, первый вопрос анкеты вместе с вариантами ответов звучал следующим образом:
1. К какому типу избирателей Вы себя относите?
1 — участвую обычно во всех выборах.
2 — участвую только в тех выборах, когда хорошо известны кандидаты и их предвыборные программы.
3 — участвую или не участвую в выборах по случайным причинам (настроение, погода, занятость домашними делами и т.д.).
4 — обычно не участвую ни в каких выборах.
После того как мы проделаем все описанные выше манипуляции по загрузке файла в окно Word, соответствующее распределение ответов по первой переменной будет выглядеть следующим образом13:
VAR00001
Valid Cum Value Label Value Frequency Percent Percent Percent
0,00 | 1,3 | 1,3 | 1,3 | ||
1,00 | 31,7 | 31,7 | 33,0 | ||
2,00 | 27,5 | 27,5 | 60,5 | ||
3,00 | 24,5 | 24,5 | 85,1 | ||
4,00 | 14,9 | 14,9 | 100,0 | ||
Total | 100,0 | 100,0 | |||
Valid cases | Missing | cases |
Понятно, что в таком виде полученные данные анализировать было бы довольно трудно, в особенности человеку, не искушенно-; му в прикладной социологии. Поэтому необходимо преобразовать их
в привычный табличный вид. Вначале предстоит провести несколько подготовительных операций. Два последних столбца содержат такие данные, которые нам в дальнейшем не пригодятся14. Избавиться от них можно, вырезав (удалив) этот фрагмент. Мы рекомендуем такой прием редактирования: нажмите клавишу <Alt>, после чего выставьте курсор в нижний (или верхний) правый угол последней колонки и, не отпуская клавиши <Alt>, щелкните левой клавишей мыши и, удерживая ее в этом положении, обведите обе колонки (выделив тем самым фрагмент, подлежащий удалению):
VAR00001
Value | Frequency | Percent | Percent | Percent |
0,00 | 1,3 | 1,3 | 1,3 | |
1,00 | 31,7 | 31,7 | 33,0 | |
2,00 | 27,5 | 27,5 | 60,5 | |
3,00 | 24,5 | 24,5 | 85,1 | |
4,00 | 14,9 | 14,9 | 100,0 | |
Total | 100,0 | 100,0 | ||
_________ | _________ |
Valid
Cum
После этого с помощью клавиши <Del> удалите выделенный фрагмент. Точно так же удаляется и лишнее поле слева. Теперь можно удалить лишние знаки и целые строки, после чего заготовка таблицы приобретет такой вид:
VAR00001
Value Frequency Percent
0,00 | 1,3 | |
1,00 | 31,7 | |
2,00 | 27,5 | |
3,00 | 24,5 | |
4,00 | 14,9 | |
Total | 100,0 |
Учитывая, что надписи в таблице должны быть сделаны по-русски, необходимо изменить англоязычные термины на рус-230
ские. Поскольку файл обычно содержит не одно распределение, а сразу все, лучше проделать соответствующую замену одновременно для всего файла. Поэтому выберите команду Правка -» Заменить;в окошке «Найти» наберите «Value», а в окошке «Заменить» — «Вариант ответа»; затем нажмите клавишу «Заменить все». Проделайте аналогичную операцию для всех остальных пар замены:
Frequency -> Частота
Percent -> Процент
Total -> Всего.
Изменив характер шрифта (лучше выбрать Times New Roman) и задав соответствующий размер, вы получите такой вид:
Вариант ответа Частота Процент
0,00 | 1,3 | |
1,00 | 31,7 | |
2,00 | 27,5 | |
3,00 | 24,5 | |
4,00 | 14,9 | |
100,0 |
Всего
Теперь поставьте знак [; ] (точка с запятой) в конце двух первых столбцов (в последнем столбце не ставить!):
г
Вариант ответа; Частота; Процент
0,00; 11; 1,3
I 1,00; 261; 31,7
| 2,00; 226; 27,5
3,00; 202; 24,5
4,00; 123; 14,9
L
Всего
823;
100,0
Выделите все три колонки и с помощью команды Таблица-> Добавить таблицупоместите тем самым обрабатываемый материал во вновь созданную таблицу:
Вариант ответа | Частота | Процент |
0,00 | 1,3 | |
1,00 | 31,7 | |
2,00 | 27,5 | |
3,00 | 24,5 | |
4,00 | 14,9 | |
Всего | 100,0 |
Таблица будет лучше выглядеть, если в двух последних колонках мы произведем выравнивание «по центру»: | ||
Вариантответа | Частота | Процент |
0,00 | 1,3 | |
1,00 | 31,7 | |
2,00 | 27,5 | |
3,00 | 24,5 | |
4,00 | 14,9 | |
Всего | 100,0 |
Заключительная часть работы состоит в том, чтобы: 1) заменить номера вариантов ответов на их содержание, заданное анкетой (заменив при этом в формулировках вопросов первое лицо на третье и, по возможности, сократив, выразив самую суть); 2) проставить ее порядковый номер и 3) сформулировать заголовок таблицы. Для придания более представительной и компактной формы можно также выполнить команду Таблица-> Автоформат-» Сетка 1.Таблица приобретет окончательный вид:
Таблица 5.4
Самоидентификация по типу избирателей
Вариантответа | Частота | Процент |
Не дали ответа" | 1,3 | |
Участвуют во всех выборах | 31,7 | |
Участвуют, когда известны кандидаты | 27,5 | |
Участвуют по случайным причинам | 24,5 | |
Не участвуют ни в каких выборах | 14,9 | |
Всего | 100,0 |
Теперь, как нам кажется, табл. 5.4 стала вполне понятной, обозримой и удобной для анализа методами описательной статистики16.
Несколько иначе выглядит процедура редактирования в текстовом редакторе Word комбинационных таблиц, рассчитанных средствами SPSS версий 4.0 и 6.017. Рассмотрим этот процесс для крос-стаба, отражающего в том же исследовании связь между возрастом и участием в выборах. Кросстабуляция в данном случае
представляла собою наложение двух переменных — участие в выборах (var0000218) и возраст (varOOO55).
Предположим, что в упомянутом выше исследовании вы намереваетесь проверить гипотезу о наличии связи между возрастом опрошенных (респондентов) и их участием в выборах. Для этого вы производите кросстабуляцию соответствующих переменных — участие в выборах (по колонкам) и возраст (по строкам). В анкете соответствующие вопросы выглядели так:
Дата добавления: 2016-11-22; просмотров: 893;