Принципы построения статистических группировок
Построение статистических группировок осуществляется по следующим этапам:
1. Определение группировочного признака.
2. Определение числа групп.
3. Расчет ширины интервала группировки.
4. Определение признаков, которые в комбинации друг с другом будут характеризовать каждую выделенную группу.
Построение группировки начинается с определения группировочного признака. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки.
После того, как определено основание группировки следует решить вопрос о количестве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема изучаемой совокупности и степени вариации признака.
Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Величина интервала представляет собой разность между его верхней и нижней границами.
В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь неравные интервалы подразделяются на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Равные интервалы применяются в случае, если изменение количественного признака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.
Ширина равного интервала определяется по формуле Стерджесса:
(2.1) |
где - минимальное значение признака в совокупности,
- максимальное значение признака в совокупности,
N - объем совокупности.
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или минимальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами. Неравные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если после построения равных интервалов по изучаемому признаку образуются группы, содержащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необходимость в увеличении интервалов группировки.
Выбор исследователя в построении равных или неравных интервалов зависит от степени заполнения каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.
Интервалы группировок могут быть закрытыми и открытыми.
Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.
Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех остальных значений изучаемого признака.
Вариационный ряд можно изобразить графически. Дискретный вариационный ряд можно изобразить в виде полигона распределения. Полигон распределения строится в прямоугольной системе координат, при этом, на оси абсцисс откладывают значения вариант, а на оси ординат частоты или частости. Полученные точки соединяют отрезками, в результате чего получается ломаная линия, которая и будет полигоном распределения.
Например, в таблице 2.1 представлен дискретный вариационный ряд, так как значения признака могут принимать конечное число отдельных значений.
Таблица 2.1
Распределение семей по числу детей
Число детей в семье ( ) | Число семей ( ) |
Полигон распределения по этим данным представлен на рисунке 2.3.
Рисунок 2.3. Полигон распределения семей по числу детей[1]
Интервальный вариационный ряд можно изобразить в виде гистограммы распределения. Для интервального ряда с равными интервалами на оси абсцисс откладывают отрезки равные длине интервала. На основании этих отрезков строят прямоугольники, высота которых пропорциональна частотам или частостям соответствующих интервалов.
Гистограмма (рис.2.4) построена по данным таблицы 2.2.
Таблица 2.2
Распределение специалистов коммерческих банков
по величине заработной платы
Величина заработной платы, тыс. руб. | Количество специалистов, чел. |
17-27 | |
27-37 | |
37-47 | |
47-57 | |
57-67 | |
67-77 | |
Итого |
Рисунок 2.4. Гистограмма распределения[2]
Дискретные и интервальные вариационные ряды можно представить в виде кумуляты и огивы.
При построении кумуляты дискретного вариационного ряда на оси абсцисс откладывают значения признака (варианты), а по оси ординат – соответствующие им накопленные частоты (частости). Кумулята дискретного вариационного ряда представляет собой ступенчатую разрывную линию, имеющую конечные разрывы в точках, соответствующим значениям варианта. Для интервального вариационного ряда кумулята представляет собой ломанную, начинающуюся с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломаной соответствуют концам интервалов.
Огива строится аналогично кумуляте лишь с той разницей, что на оси абсцисс откладываются значения, соответствующие накопленным частотам (частостям), а на оси ординат – значения признака (варианты).
Дата добавления: 2014-12-21; просмотров: 1070;