Группировочный признак и интервал.
Одной из важнейших задач статистики является применение уже имеющихся и нахождение универсальных методов группировки. Метод группировки основывается на двух категориях — группировочном признаке и интервале.
Группировочный признак — это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.
Классификация и группировка должны производиться на основание вполне распознаваемых признаков. При этом признаки могут носить как атрибутивный, так и количественный характер. Следует иметь в виду, что в ряде случаев классификация, которая представляется чисто качественной, в конечном итоге оказывается основанной на количественном признаке. Такова, например, классификация промышленных предприятий по отраслям. Поскольку одно и то же предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.
Интервал определяет количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака о группе. Интервалы бывают:
1. равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;
2. неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;
3. открытые, когда имеется только либо верхняя (например, (-∞;1]), либ
нижняя граница (например,[1;+∞ ));
4. закрытые,когда имеются и нижняя, и верхняя границы (например [1;5]).
Число групп тесно связано с объемом совокупности. Здесь нет строго научных приемов, позволяющих решать этот вопрос при любых взаимосвязях названных величин. Всякий раз эта задача решается с учетом конкретных обстоятельств. Однако при равенстве интервалов для ориентировки применяют формулу, предложенную американским ученым Стерджессом, с помощью которой можно наметить число групп n при известной численности совокупности N:
n = 1 + 3,322 lg N, (1)
где n –количество интервалов, N – численность совокупности.
При 200 единицах совокупности число групп определяется следующим образом:
1 + 3,322 lg200 = 8,64 =9.
Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность из большого числа единиц и распределение единиц совокупности по признаку, положенному в основание группировки, близко к нормальному.
Зная размах колеблемости значений изучаемого признака во всей совокупности и намечаемое число групп, величина равного интервала i определяется по формуле
i = (xmаx –xmin )/n (2)
где n – число групп,
Xmax Xmin - максимальное и минимальное значение признака соответственно.
Пример: Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом значения признаков:
Xmax =2040 млн. грн.
Xmin =290 млн. грн.
N =80
1. Определим количество групп по формуле Стерджеса:
n = 1+3.322 lg80 = 7,322065 »7
2. Найдем размах вариации:
R =2040 – 290 = 1750 млн. грн.
3. Определим величину интервала:
h = 1750/7 = 250 млн. грн.
Приведем 2 варианта построения интервала групп:
ГРУППА | ИНТЕРВАЛ | |
1 вариант (закрепленные границы) | 2 вариант (открытые границы) | |
I | 290-540 | До 540 |
II | 540-790 | 540-790 |
… | … | … |
VI | 1540-1790 | 1540-1790 |
VII | 1790-2040 | 1790 и более |
Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки.
Типы группировок
Типы группировок приведены в таблице 1.
Таблица 1.
При проведении группировки решают следующие задачи:
1) выделение группировочного признака;
2) определение числа групп и величины интервалов;
3) описание правил комбинирования признаков, если их несколько;
4) установление показателей, которыми должны характеризоваться группы.
Рассмотрим методологические вопросы построения различных видов группировок.
По способу формирования типологических групп различают:
1) способ последовательных разбиений, заключающийся в формировании таких групп, в которых все объекты имеют одинаковые значения классификационных признаков;
2) способ многомерной классификации. В этом случае объекты, образующие группы, могут иметь различные значения классификационных признаков.
Первый способ является исторически более ранним. Он включает в себя два метода. Во-первых, это типичный для него метод комбинационной группировки, при которой формирование групп производится путем последовательного разбиения сначала всей совокупности по одному признаку, затем полученных [х частей — по другому] и т. д., причем строго соблюдается принцип иерархии групп. Во-вторых, это многошаговый метод последовательных разбиений совокупности. Способ многомерной классификации, когда группы формируются на основе близости объектов одновременно по большому числу признаков, получил широкое применение с разработкой методов распознавания образов и появлением ЭВМ.
Типологические группировки широко применяются в экономических, социальных и других исследованиях.
Приведем пример типологической группировки (табл. 2.1).
Таблица 2.1
Распределение промышленной продукции, произведенной в различных формах хозяйствования за отчетный период.
Группы предприятий по формам хозяйствования | Объем промышленной продукции, млрд. грн. | % к итогу |
Государственные | 405,0 | 89,20 |
Арендные | 19,0 | 4,19 |
Кооперативные | 30,0 | 6,61 |
Всего | 454,0 | 100,0 |
При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам, Очередность этапов здесь такова,
1) наметка типов;
2) выбор группировочного признака (признаков);
3) определение числа групп и величины интервалов;
4) сведение выделенных групп в типы;
5) характеристика типов с помощью системы показателей.
Наметка типов производится с помощью качественного теоретического анализа. Предварительно намечают столько типов, сколько их может быть в данной совокупности теоретически (хотя фактически возможно меньшее их число).
При выборе группировочного признака необходимо учитывать два условия. Во-первых, типологическая группировка должна выполняться только по существенным признакам. Теоретически следует охватить все существенные признаки, однако при таком подходе получается излишнее дробление совокупности. Группы оказываются малыми по объему и не пригодны для статистического анализа. Поэтому рекомендуется проводить группировку по двум-трем главным признакам, взятым в комбинации. Во-вторых, при необходимости для характеристики разных типов выбираются различные признаки, т. е. осуществляется специализация признака. Например, для выделения типов населения по размеру среднегодового дохода будет выступать признак: min размер годового дохода. Далее же количественные признаки: min размер среднемесячной заработной платы, дивиденды получаемые по акциям, доход полученный из других источников.
На различных этапах формирования типологической группировки число групп неодинаково. По ее завершение оно соответствует фактическому числу выделенных типов.
В случае количественного группировочного признака необходимо определять величину интервалов. Интервалы задают критические точки перехода одного качества в другое. При построении типологической группировки интервалы должны быть неравными и специализированными. Специализация интервалов означает, что разным значениям одного признака соответствуют разные значения другого.
В ходе научных исследований обнаружилось, что принципы чистой логики, лежащие в основе метода комбинационной группировки, часто бывает нелегко применять к эмпирическому (практическому) материалу. Это обусловило необходимость разработки новых принципов группировки, отличных от традиционных.
Сущность этих новых принципов, лежащих многомерной классификации, состоит в следующем. Классификация объектов производится не последовательно по отдельным признакам, а одновременно по большому числу признаков. Этот фиксированный набор признаков образует так называемое пространство признаков, а каждому признаку придается смысл координаты. Если задано m существенных признаков совокупности, то любой объект рассматривается как точка в m-мерном пространстве признаков и задача классификации сводится к выделению сгущений объектов в этом пространстве. Для этого используются разные алгоритмы, но всегда группы (типы, классы) формируются на основании близости объектов по комплексу признаков.
Например. Как известно, любая социальная группа имеет свою классификацию материальных ценностей. Допустим, что в некотором обществе преобладает тенденция характеристики материального благосостояния человека по двум признакам: а) величина годового дохода; б) цена страхового полиса. Ответим на вопрос, по графику (рис. 1), какое количество человек принадлежит к среднему классу, к богатым людям, сверх - богатым, к бедным. Пусть количество человек в данном обществе равно = 6. В соответствии с вышеуказанным определением получим график, где m = 2. Координаты точек характеризуют материальное благосостояние каждого из членов общества. По скоплению точек, т. е. по размеру расстояния между ними и определению его min и max интервала можно ответить на вопрос задачи (рис. 1).
Решение: 5,6 человек относятся к малообеспеченному классу, поскольку расположены наиболее близко к оси X и Y и друг к другу; соответственно 4 и 1-ый человек принадлежит к классу богатых, поскольку величины по осям у них выше, 3 и 2 - ой принадлежит к классу сверх-богачей, поскольку имеет максимальный доход. По этому методу можно проводить и более глубокий анализ, если размерность пространства будет увеличена.
Рис. 1. Скопление точек в пространстве признаков при m = 2.
Следовательно, главное преимущество методов многомерной группировки заключается в том, что они позволяют с той или иной степенью приближения выделить реально существующие в признаковом пространстве скопления точек – объектов.
Выбор одного из указанных способов классификации во многом определяется характером признаков, составляющих описание объекта. Если преобладают качественные признаки, их не очень много и априори известно, что они неравнозначны с точки зрения цели классификации, то целесообразнее использовать способ последовательного разбиения. При наличии большого числа примерно равнозначных признаков, особенно если это признаки количественные, а вопрос иерархии признаков и групп не столь важен, следует ориентироваться на многомерную классификацию.
Структурная группировка - это группировка, выявляющая состав (строение, структуру) однородной в качественном отношении совокупности по какому – либо признаку. Примером могут служить группировки предприятий по проценту выполнения плана, по числу рабочих и т.д. Состав населения может быть сгруппирован по полу, по возрасту, по уровню образования, по роду занятий и т.д . Значение такого рода группировок заключается в том, что с их помощью могут быть выделены и изучены группы предприятий передовых, средних, отстающих; выявлены неиспользованные резервы производства, например, в области улучшения использования основных фондов, повышение производительности труда, улучшение качества продукции и т. д. Группировка населения по возрасту, например, необходима для проведения различных расчетов, связанных с медицинским, культурным, бытовым обслуживанием населения, для вычисления специальных демографических показателей и т.д.
Пример структурной группировки (табл. 2.2).
Таблица 2.2.
Группы заводов по среднегодовой стоимости ОПФ, млн. грн. | Численность рабочих. | |
человек | В % к итогу | |
1,0-2,2 | 13,86 | |
2,2-3,4 | 53,25 | |
3,4-4,6 | 32,89 | |
Итого | 100,0 |
Наибольшая численность рабочих приходится на группу заводов со среднегодовой стоимостью ОПФ от 2,2 до 3,4 млн. грн.
Аналитическая группировка – это группировка, которая применяется для исследования взаимосвязи между явлениями. Используя аналитические группировки, определяют факторные и результативные признаки изучаемых явлений. Факторные – это признаки, оказывающие влияние на другие, связанные с ними признаки. Результативные – это признаки, которые изменяются под влиянием факторных. Пример аналитической группировки (табл. 2.3).
Таблица 2.3.
Группы магазинов по объему товарооборота, тыс. грн. | Торговая площадь м2 |
1700-2000 | 18,5 |
2000-3000 | 22,5 |
3000-4200 | 59,0 |
Всего | 100,0 |
Чем больше торговая площадь (факторный признак), тем выше объем товарооборота ( результативный признак).
Дата добавления: 2016-01-09; просмотров: 4631;