Анализ количественных данных
1. Группировка данных (построение рядов распределения), т.е. упорядочивание значений в определённой последовательности.
Этапы группировки:
1. Предварительный анализ полученных данных;
2. Формирование таблицы: 3 столбца (изучаемый признак, частота повторений значений признака, доля значений признака в общей совокупности);
3. Определяются интервалы группировки данных;
4. Производится подсчёт количества значений признака и заполнение таблицы.
Пример: рассмотрим данные о возрасте студентов первого курса одной из групп 15 человек. Получена следующая информация:
16, 17, 17, 17, 17, 18, 17, 16, 17, 18, 16, 18, 17, 17, 17.
Возраст студента | Количество студентов | Доля, % |
16 | 3 | 20 |
17 | 9 | 60 |
18 | 3 | 20 |
ИТОГО: | 15 | 100 |
В некоторых случаях, когда значения признака изменяются в широких пределах, для упрощения интерпретации данные группируются в интервалы. Для этого сначала определяется количество групп:
- самостоятельно исследователи, исходя из смыслового содержания изучаемого явления;
- по формуле Стерджеса:
,
где - количество единиц в исходной совокупности, - количество групп
15-24 | 25-44 | 45-89 | 90-179 | 18-359 | 360-719 |
- определяется ширина интервала группы:
,
где - наибольшее и наименьшее значение признака.
- определяются интервальные границы, начиная с первого, путем прибавления к нижней границе каждого интервала рассчитанной ширины интервала i: Хmin – X min+i;
- строится ряд распределения.
Пример:
Имеются данные о стаже работника бригады, состоящей из 22 человек:
2,4,5,5,6,6,5,6,6,7,7,8,8,9,10,11,4,3,3,4,4,5.
года
Стаж | Число работников | Доля, % |
2-3 | 3 | 14 |
4-5 | 8 | 36 |
6-7 | 6 | 27 |
8-9 | 3 | 14 |
10-11 | 2 | 9 |
ИТОГО: | 22 | 100 |
Перекрестная группировка - группировка по двум и более признакам используется для выявления наличия (или отсутствия) взаимосвязи между признаками.
Наиболее часто применяемой является таблица размерностью 2*2, общая форма которой представлена ниже.
Признак X / Признак | Y1 | Y2 | Итого: |
X1 | a | b | a+b |
X2 | c | d | c+d |
Итого: | a+c | b+d | a+b+c+d |
Примеры:
1. Кто покупает современные детективы российских и зарубежных авторов: мужчины или женщины? В данном примере совмещаются 2 признака: авторство детективов (российский или зарубежный) и пол покупателя (мужской или женский). В опросе приняло участие 200 человек (100 мужчин и 100 женщин).
Признаки покупателей | Российские детективы | Зарубежные детективы | Общее число |
Мужчины | 70 чел | 30 чел | 100 чел |
Женщины | 50 чел | 50 чел | 100 чел |
Итого | 120 чел | 80 чел | 200 чел |
2. Участие работников акционерного общества в предложении инноваций на предприятии (1000 чел.):
Категория работников | Участвую в инновациях | Не учувствую в инновациях | Итого: |
Рабочие | 250 | 455 | 705 |
ИТР | 140 | 120 | 260 |
Руководство | 10 | 25 | 35 |
Итого: | 400 | 600 | 1000 |
Способом количественной оценки взаимосвязи двух признаком является коэффициент Юла:
Коэффициент изменяется в пределах от -1 до+1. Абсолютное значение коэффициента показывает степень связи для изучаемых пар величин. Чем ближе его модулю к значение 1, тем сильнее связаны измеряемые характеристики. При положительном значении связь прямая, при отрицательном - обратная относительно изучаемым признакам.
Дата добавления: 2015-02-05; просмотров: 1107;