Зависимость между рентабельностью и продуктивностью животноводства.
Группы колхозов по рентабельности животноводства, % | Число фермерских хозяйств | Средняя продуктивность животноводства, руб. на 1 условную голову |
До 0 | 23,55 | |
0-5 | 24,90 | |
5-10 | 25,97 | |
10 и выше | 26,24 | |
Итого | 24,96 |
Классификация – разновидность типологической группировки множества единиц статистической совокупности. Она применяется в целях упорядочения распределения единиц, элементов массового наблюдения в тех случаях, когда группировочный признак атрибутивный (качественный) и представлен большим и устойчивым в течение длительного периода количеством разновидностей, как, например, род занятий (профессия), причина смерти, произведенные в народном хозяйстве изделия, различные товары и т.п. Классификация может включать в себя сотни и даже тысячи разновидностей атрибутивного признака. Они дополняются и конкретизируются в номенклатуре, которая представляет собой группы и подгруппы близких по своей природе разновидностей.
Итак, основные задачи всех группировок тесно взаимосвязаны между собой, взаимно переплетаются, дополняют друг друга.
3)После того, как решен вопрос, какую задачу будет решать группировка, и отобраны соответствующие признаки, встает вопрос об определении числа групп и установлении границ между ними.
В тех случаях, когда количественный признак группировки дискретный и варьируется в узких пределах, вопрос о числе групп в типологической группировке решается очень просто, например,
Тарифный разряд, х | Число рабочих в % к итогу, f | Так группируются рабочие по разрядам, семьи по количеству членов семьи и т.п., а затем в зависимости от задач исследования могут объединятся в более крупные группы. Когда же дискретный признак варьируется в широких пределах и, следовательно, имеет много значений, тогда образуются интервалы. Последние образуются и в тех случаях, когда группировочный признак |
ИТОГО |
непрерывный.
Интервал – промежуток между двумя значениями количественного группировочного признака, в пределах которого все значения признака относятся к одной группе, как например, группа рабочих, получающих заработную плату от 20 сомони до 25 сомони. Интервалы бывают равными и неравные. При равных интервалах промежуток между двумя значениями признака одинаковый во всех группах, а при неравных – изменяется от одной группы к другой. Неравные интервалы в свою очередь делятся на возрастающие, которые увеличиваются от одной группы к другой, и убывающие, которые уменьшаются. Открытыми интервалы бывают обычно в первой и последней группах. Границы интервалов должны быть обозначены с такой точностью и значностью, чтобы было совершенно ясно, в какую группу следует отнести те или иные единицы совокупности.
Случай I | Случай II | Случай III | ||
Интервалы равные | Интервалы неравные | |||
Возрастающие | Убывающие | |||
Группы деталей по весу, т | Группы заводов по выработке продукции на 1 рабочего, руб | Группы предприятий по проценту бракованной продукции | ||
От 1 до 10 | менее 3000 | 10 и более | ||
10-20 | 3000-4000 | 5-10 | ||
20-30 | 4000-6000 | 3-5 | ||
30-40 | 6000-10000 | 1-3 | ||
40 и более | 10000 и более | менее 1 |
В случае I последний интервал открытый, а все другие закрытые. В случаях II и III первый и последний интервалы открытые. В случае I верхняя граница каждого интервала совпадает с нижней границей последующего интервала. Но в первом же интервале слово «до» указывает, что детали весом в 10 т. включаются не в этот интервал, а в следующий и что аналогично надо поступать в отношении остальных групп. На это же указывает и запись последнего интервала «40 и более». В случаях II и III аналогичные функции выполняют слова «менее» и «более».
Для типологической группировки обычно больше подходят неравные интервалы, так как одинаковое количество единиц имеет разное экономическое или социальное значение на разных уровнях группировочного признака.
Проще решается вопрос о числе групп, размерах и границах интервалов для структурной группировки. Так как такая группировка применяется к качественно однородной совокупности, то решение вопроса сводится к тому, чтобы определить, при каком минимальном размере интервала, равном для всех групп, четко проявляется эта закономерность. Чем меньше этот интервал, тем точнее и детальнее можно описать закономерность, свойственную явлению. Задача легко решается, когда совокупность состоит из небольшого количества единиц, не более 100-150. В этом случае первичные данные о размере каждой единицы совокупности располагаются в восходящем порядке. В результате получается ряд, который называется ранжированным рядом. Примером могут служить следующие данные.
Ранжированный ряд заработной платы 100 рабочих завода (сомони).
По этому ряду видно, что минимальная заработная плата составляет 99 сомони, а максимальная 301 сомони. Но этого мало для описания ряда. Чтобы выявить закономерность ряда и определить, при каком минимальном размере интервала она проявляется, следует сначала взять малый интервал, допустим 5 сомони. Если же при таком интервале закономерность четко не проявляется, следует постепенно увеличивать интервал. (см. таблицу 3)
По данным таблицы видно, что при интервале 5 сомони получается 42 группы – в каждую группу попадают единичные случаи и поэтому закономерность не видна. При интервале 10 сомони закономерность проявляется, хотя и недостаточно отчетливо, а при интервале 20 сомони – весьма отчетливо. Когда объем совокупности измеряется сотнями, тысячами и более единиц, такой способ определения размера равного интервала чрезмерно громоздок. Поэтому практика в одних случаях ориентируется на распределение прошлых периодов. Считается нежелательным частое изменение размеров интервалов, так как это осложняет изучение структурных сдвигов от одного периода к другому. Изменения вносятся в тех случаях, когда иначе невозможно разобраться в закономерностях текущего периода. Если же группировка производится впервые или же имеющаяся группировка настолько устарела, что ею нельзя пользоваться, то производится опытная группировка на основе выборочного наблюдения.
Таблица 3.
Интервал 5 сомони | Интервал 10 сомони | Интервал 20 сомони | |||||
Месячная заработная плата, сомони | Количество рабочих | Месячная заработная плата, сомони | Количество рабочих | Месячная заработная плата, сомони | Количество рабочих | Месячная заработная плата, сомони | Количество рабочих |
До 100 | 200-205 | До 100 | До 100 | ||||
100-105 | 205-210 | 100-110 | 100-120 | ||||
105-110 | - | 210-215 | 110-120 | 120-140 | |||
110-115 | 215-220 | 120-130 | 140-160 | ||||
115-120 | 220-225 | 130-140 | 160-180 | ||||
120-125 | 225-230 | 140-150 | 180-200 | ||||
125-130 | 230-235 | 150-160 | 200-220 | ||||
130-135 | 235-240 | 160-170 | 220-240 | ||||
135-140 | 240-245 | 170-180 | 240-260 | ||||
140-145 | 245-250 | 180-190 | 260-280 | ||||
145-150 | 025-255 | 190-200 | 280-300 | ||||
150-155 | 255-260 | 200-210 | 300 и выше | ||||
155-160 | 260-265 | 210-220 | Итого 100 | ||||
106-165 | 265-270 | 220-230 | |||||
165-170 | 270-275 | 230-240 | |||||
170-175 | 275-280 | - | 240-250 | ||||
175-180 | 280-285 | 250-260 | |||||
180-185 | 285-290 | - | 260-270 | ||||
185-190 | 290-295 | 270-280 | |||||
190-195 | 295-300 | 280-290 | |||||
195-200 | 300 и выше | 290-300 | |||||
Итого 100 | 300 и выше | ||||||
Итого 100 |
Существует математический способ приближенного определения величины интервала, предложенный американским ученым Г.А. Стерджессом. По этому способу размер интервала определяется:
xmax - xmin
i = ----------------- , где xmax – максимальное значение изучаемого признака
1 + 3.322 lgN
(в нашем примере 301 сомони), xmin – минимальное значение интервала (99 сомони), а N – число единиц совокупности (100).
301-99 202
Следовательно, в нашем примере i = --------------- = --------- = 26,4 сомони,
1+3,322*2 7,644
что близко к 20, как это мы получили эмпирическим путем. Значения интервала, определенные по формуле Стерджесса, следует для удобства округлять.
При определении числа групп и величины интервалов для аналитической группировки возникают специфические проблемы. Поскольку целью такой группировки является изучение связи между факторными признаками и результативными в однородной совокупности, то принято считать, что такие группировки должны строиться методом равных интервалов. При этом методе величину интервала определяют как частное от деления разницы между крайними значениями признака на число групп, т.е. по формуле:
xmax - xmin
i = ------------------ , где xmax – максимальное значение признака, xmin –
n
минимальное его значение, n – число групп. Например, если для изучения влияния возраста студентов первого курса дневного обучения на их успеваемость решено делить их на групп, то так как возраст их варьирует от 17
35-17
до 35 лет, величина интервала будет: ----------- =3. При этих условиях
получаются такие интервалы: 1) 17-20; 2) 20-23; 3) 23-26; 4) 26-29; 5) 29-32;
6) 32 до 35 со средними значениями 18, 21, 24, 27, 30, 33.
Удобство равных интервалов заключается в том, что равномерное нарастание фактора позволяет точнее изучить характер его влияния на результативный показатель и форму связи. Выбор величины и границ интервалов аналитической группировки и числа групп не должен быть произвольным, так как тенденциозным подбором можно существенно повлиять на группировку: при одних интервалах она получается вполне эффективной, а при других малоэффективной. Для этого рекомендуется некоторые стандартизированные подходы, каким является и метод равных интервалов. Но так как реальная жизнь сложнее любых стандартов, приходится вносить в них разные коррективы, учитывающие природу явлений, логику и здравый смысл. Кроме метода равных интервалов, известны и другие стандартизированные методы для определения числа групп, размеров и границ интервалов (формула Стерджесса, метод равных частот), каждому из них свойственны свои достоинства и недостатки.
Число групп определяется по формуле Стерджесса: n=1 + 3.322 lgN, где n -число групп, N- число единиц в изучаемой совокупности. Зависимость между n и N получается следующая:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 | 720-1439 |
n |
Из формулы Стерджесса следует, что чем больше единиц в совокупности, т.е. больше объем совокупности, тем больше должно быть образовано групп, что соответствует логике, здравому смыслу и задачам аналитической группировки. Формула Стерджесса, применяемая к равным интервалам, по природе своей пригодна лишь в тех случаях, когда распределение единиц совокупности по величинам изучаемого признака нормальное или приближается к нормальному, а объем совокупности велик. Такое распределение не так часто встречается в явлениях общественной жизни. В частности, в примере с распределением студентов по возрасту, частота каждой исследуемой группы меньше предыдущей, т.е. распределение ничего общего не имеет с нормальным. К тому же для определения числа групп аналитической группировки приходится считаться не только с формой распределения совокупности и ее объемом, но и с размахом вариации признака. Например, одно дело группировать студентов по возрасту, который в этом случае варьирует в пределах от 17 до 35 лет, для изучения влияния возраста на успеваемость, а другое – группировать рабочих по возрасту, который колеблется от 16 до 60 лет и более, для анализа влияния возраста на производительность труда. Вполне понятно, что для второго случая требуется больше групп даже при одном и том же количестве единиц совокупности. К тому же рабочие по возрасту распределяются иначе, чем студенты. На практике число групп определяется с учетом объема совокупности, размаха вариации и теоретических соображений о форме распределения, либо соображений базирующихся на прошлом опыте или предварительных пробных группировках, которые не требуют большого труда, когда совокупность измеряется десятками или сотнями единиц. Возможно применение в таких случаях и неравных интервалов, если в этом есть надобность. Но при неравных интервалах сила влияния факторного признака на результат определяется межгрупповыми разностями результативного признака, отнесенного не на единицу факторного признака, а на единицу разницы между средними значениями факторного признака. Например, если бы в примере с группировкой студентов по возрасту интервал первой группы составил 17-19 лет, второй группы 20-24 года, а средний балл успеваемости соответственно 3,8 и 4,2 балла, то влияние возраста на успеваемость определялось бы так:
4,2-3,8 0,4
---------------- = ------- = 0,1. Это значило бы, что с увеличением возраста
22-18 4
студентов на один год успеваемость повышается в среднем на 0,1 балла.
Методу равных интервалов, как и методу определения числа групп по формуле Стерджесса, свойственен и такой недостаток. При нормальном распределении они приводят к тому, что в крайние группы попадает недостаточное количество единиц совокупности для того, чтобы получить достоверные результаты. Это особенно важно при малых совокупностях. Сравнение же крайних групп обычно представляет наибольший интерес. Сказанное относится не только к нормальному распределению. В частности, в примере с распределением студентов по возрасту совсем мало студентов окажется в группах старше 25 лет. Поэтому практически при малых интервалах в аналитических группировках нужно стараться подобрать такие интервалы, чтобы общее число единиц совокупности распределялось по группам более или менее равномерно. Если довести этот принцип до логического конца, то он приводит к методу, который называется методом равных частот.
По методу равных частот совокупность расчленяется на группы таким образом, чтобы в каждую группу попало одинаковое количество единиц совокупности, что исключает возможность образования групп с незначительным количеством единиц. Это важно для обеспечения достоверности групповых характеристик результативного признака в равной мере по всем группам, включая и характеристики крайних групп, что особенно важно. Основным недостатком этого метода является то, что при равных частотах образуются неравные интервалы, что затрудняет определение влияния фактора на результативный показатель. Тем не менее метод равных частот не получил широкого распространения в статистических работах.
Все сказанное выше о группировках относится к группировкам, которые производятся на основе первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. В таких случаях производится обычно перегруппировка для образования новых групп на основании уже имеющейся группировки. Образование новых групп на основании уже имеющейся группировки называется вторичной группировкой.
В результате группировки единиц совокупности по величине какого-нибудь варьирующего признака получают ряды распределения.
Ряд распределения – это первичная характеристика массовой статистической совокупности, в которой находят количественное выражение закономерности вариации массовых явлений и процессов общественной жизни. Ряды распределения дают возможность судить о закономерности распределения и о границах варьирования совокупности. Различные обобщающие показатели (средние, мода, медиана, дисперсия и т.д.) исчисляются на основе ряда распределения.
Ряды распределения состоят из вариантов (групп по выделенному признаку) и частот (численности групп). Частоты, выраженные в виде относительных величин (долях единицы, процентах) называются частостями. Сумма всех частот называется объемом ряда распределения или его численностью.
Ряды распределения могут быть образованы как по атрибутивным признакам (например, распределение населения по полу), так и по количественным (например, распределение населения по возрасту). В соответствии с этим они делятся на атрибутивные и вариационные ряды распределения.
Вариационные ряды, как и статистические количественные признаки, подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных признаках, интервальные – на непрерывных признаках, либо на дискретных признаках, представленных в виде интервалов.
Тема 4. Абсолютные и относительные величины.
1. Абсолютные величины, их виды и единицы измерения.
Дата добавления: 2015-04-29; просмотров: 1118;