Зависимость между рентабельностью и продуктивностью животноводства.

Группы колхозов по рентабельности животноводства, % Число фермерских хозяйств Средняя продуктивность животноводства, руб. на 1 условную голову
До 0 23,55
0-5 24,90
5-10 25,97
10 и выше 26,24
Итого 24,96

Классификация – разновидность типологической группировки множества единиц статистической совокупности. Она применяется в целях упорядочения распределения единиц, элементов массового наблюдения в тех случаях, когда группировочный признак атрибутивный (качественный) и представлен большим и устойчивым в течение длительного периода количеством разновидностей, как, например, род занятий (профессия), причина смерти, произведенные в народном хозяйстве изделия, различные товары и т.п. Классификация может включать в себя сотни и даже тысячи разновидностей атрибутивного признака. Они дополняются и конкретизируются в номенклатуре, которая представляет собой группы и подгруппы близких по своей природе разновидностей.

Итак, основные задачи всех группировок тесно взаимосвязаны между собой, взаимно переплетаются, дополняют друг друга.

 

3)После того, как решен вопрос, какую задачу будет решать группировка, и отобраны соответствующие признаки, встает вопрос об определении числа групп и установлении границ между ними.

В тех случаях, когда количественный признак группировки дискретный и варьируется в узких пределах, вопрос о числе групп в типологической группировке решается очень просто, например,

Тарифный разряд, х Число рабочих в % к итогу, f Так группируются рабочие по разрядам, семьи по количеству членов семьи и т.п., а затем в зависимости от задач исследования могут объединятся в более крупные группы. Когда же дискретный признак варьируется в широких пределах и, следовательно, имеет много значений, тогда образуются интервалы. Последние образуются и в тех случаях, когда группировочный признак
ИТОГО

непрерывный.

Интервал – промежуток между двумя значениями количественного группировочного признака, в пределах которого все значения признака относятся к одной группе, как например, группа рабочих, получающих заработную плату от 20 сомони до 25 сомони. Интервалы бывают равными и неравные. При равных интервалах промежуток между двумя значениями признака одинаковый во всех группах, а при неравных – изменяется от одной группы к другой. Неравные интервалы в свою очередь делятся на возрастающие, которые увеличиваются от одной группы к другой, и убывающие, которые уменьшаются. Открытыми интервалы бывают обычно в первой и последней группах. Границы интервалов должны быть обозначены с такой точностью и значностью, чтобы было совершенно ясно, в какую группу следует отнести те или иные единицы совокупности.

Случай I   Случай II   Случай III
Интервалы равные Интервалы неравные
  Возрастающие   Убывающие
Группы деталей по весу, т Группы заводов по выработке продукции на 1 рабочего, руб Группы предприятий по проценту бракованной продукции
От 1 до 10 менее 3000 10 и более
10-20 3000-4000 5-10
20-30 4000-6000 3-5
30-40 6000-10000 1-3
40 и более 10000 и более менее 1

В случае I последний интервал открытый, а все другие закрытые. В случаях II и III первый и последний интервалы открытые. В случае I верхняя граница каждого интервала совпадает с нижней границей последующего интервала. Но в первом же интервале слово «до» указывает, что детали весом в 10 т. включаются не в этот интервал, а в следующий и что аналогично надо поступать в отношении остальных групп. На это же указывает и запись последнего интервала «40 и более». В случаях II и III аналогичные функции выполняют слова «менее» и «более».

Для типологической группировки обычно больше подходят неравные интервалы, так как одинаковое количество единиц имеет разное экономическое или социальное значение на разных уровнях группировочного признака.

Проще решается вопрос о числе групп, размерах и границах интервалов для структурной группировки. Так как такая группировка применяется к качественно однородной совокупности, то решение вопроса сводится к тому, чтобы определить, при каком минимальном размере интервала, равном для всех групп, четко проявляется эта закономерность. Чем меньше этот интервал, тем точнее и детальнее можно описать закономерность, свойственную явлению. Задача легко решается, когда совокупность состоит из небольшого количества единиц, не более 100-150. В этом случае первичные данные о размере каждой единицы совокупности располагаются в восходящем порядке. В результате получается ряд, который называется ранжированным рядом. Примером могут служить следующие данные.

Ранжированный ряд заработной платы 100 рабочих завода (сомони).

 

                 

 

По этому ряду видно, что минимальная заработная плата составляет 99 сомони, а максимальная 301 сомони. Но этого мало для описания ряда. Чтобы выявить закономерность ряда и определить, при каком минимальном размере интервала она проявляется, следует сначала взять малый интервал, допустим 5 сомони. Если же при таком интервале закономерность четко не проявляется, следует постепенно увеличивать интервал. (см. таблицу 3)

По данным таблицы видно, что при интервале 5 сомони получается 42 группы – в каждую группу попадают единичные случаи и поэтому закономерность не видна. При интервале 10 сомони закономерность проявляется, хотя и недостаточно отчетливо, а при интервале 20 сомони – весьма отчетливо. Когда объем совокупности измеряется сотнями, тысячами и более единиц, такой способ определения размера равного интервала чрезмерно громоздок. Поэтому практика в одних случаях ориентируется на распределение прошлых периодов. Считается нежелательным частое изменение размеров интервалов, так как это осложняет изучение структурных сдвигов от одного периода к другому. Изменения вносятся в тех случаях, когда иначе невозможно разобраться в закономерностях текущего периода. Если же группировка производится впервые или же имеющаяся группировка настолько устарела, что ею нельзя пользоваться, то производится опытная группировка на основе выборочного наблюдения.

Таблица 3.

Интервал 5 сомони Интервал 10 сомони Интервал 20 сомони
Месячная заработная плата, сомони Количество рабочих Месячная заработная плата, сомони Количество рабочих Месячная заработная плата, сомони Количество рабочих Месячная заработная плата, сомони Количество рабочих
До 100 200-205 До 100 До 100
100-105 205-210 100-110 100-120
105-110 - 210-215 110-120 120-140
110-115 215-220 120-130 140-160
115-120 220-225 130-140 160-180
120-125 225-230 140-150 180-200
125-130 230-235 150-160 200-220
130-135 235-240 160-170 220-240
135-140 240-245 170-180 240-260
140-145 245-250 180-190 260-280
145-150 025-255 190-200 280-300
150-155 255-260 200-210 300 и выше
155-160 260-265 210-220 Итого 100
106-165 265-270 220-230    
165-170 270-275 230-240    
170-175 275-280 - 240-250    
175-180 280-285 250-260    
180-185 285-290 - 260-270    
185-190 290-295 270-280    
190-195 295-300 280-290    
195-200 300 и выше 290-300    
    Итого 100 300 и выше    
        Итого 100    

 

Существует математический способ приближенного определения величины интервала, предложенный американским ученым Г.А. Стерджессом. По этому способу размер интервала определяется:

xmax - xmin

i = ----------------- , где xmax – максимальное значение изучаемого признака

1 + 3.322 lgN

(в нашем примере 301 сомони), xmin – минимальное значение интервала (99 сомони), а N – число единиц совокупности (100).

301-99 202

Следовательно, в нашем примере i = --------------- = --------- = 26,4 сомони,

1+3,322*2 7,644

что близко к 20, как это мы получили эмпирическим путем. Значения интервала, определенные по формуле Стерджесса, следует для удобства округлять.

При определении числа групп и величины интервалов для аналитической группировки возникают специфические проблемы. Поскольку целью такой группировки является изучение связи между факторными признаками и результативными в однородной совокупности, то принято считать, что такие группировки должны строиться методом равных интервалов. При этом методе величину интервала определяют как частное от деления разницы между крайними значениями признака на число групп, т.е. по формуле:

xmax - xmin

i = ------------------ , где xmax – максимальное значение признака, xmin

n

минимальное его значение, n – число групп. Например, если для изучения влияния возраста студентов первого курса дневного обучения на их успеваемость решено делить их на групп, то так как возраст их варьирует от 17

35-17

до 35 лет, величина интервала будет: ----------- =3. При этих условиях

получаются такие интервалы: 1) 17-20; 2) 20-23; 3) 23-26; 4) 26-29; 5) 29-32;

6) 32 до 35 со средними значениями 18, 21, 24, 27, 30, 33.

Удобство равных интервалов заключается в том, что равномерное нарастание фактора позволяет точнее изучить характер его влияния на результативный показатель и форму связи. Выбор величины и границ интервалов аналитической группировки и числа групп не должен быть произвольным, так как тенденциозным подбором можно существенно повлиять на группировку: при одних интервалах она получается вполне эффективной, а при других малоэффективной. Для этого рекомендуется некоторые стандартизированные подходы, каким является и метод равных интервалов. Но так как реальная жизнь сложнее любых стандартов, приходится вносить в них разные коррективы, учитывающие природу явлений, логику и здравый смысл. Кроме метода равных интервалов, известны и другие стандартизированные методы для определения числа групп, размеров и границ интервалов (формула Стерджесса, метод равных частот), каждому из них свойственны свои достоинства и недостатки.

Число групп определяется по формуле Стерджесса: n=1 + 3.322 lgN, где n -число групп, N- число единиц в изучаемой совокупности. Зависимость между n и N получается следующая:

N 15-24 25-44 45-89 90-179 180-359 360-719 720-1439
n

Из формулы Стерджесса следует, что чем больше единиц в совокупности, т.е. больше объем совокупности, тем больше должно быть образовано групп, что соответствует логике, здравому смыслу и задачам аналитической группировки. Формула Стерджесса, применяемая к равным интервалам, по природе своей пригодна лишь в тех случаях, когда распределение единиц совокупности по величинам изучаемого признака нормальное или приближается к нормальному, а объем совокупности велик. Такое распределение не так часто встречается в явлениях общественной жизни. В частности, в примере с распределением студентов по возрасту, частота каждой исследуемой группы меньше предыдущей, т.е. распределение ничего общего не имеет с нормальным. К тому же для определения числа групп аналитической группировки приходится считаться не только с формой распределения совокупности и ее объемом, но и с размахом вариации признака. Например, одно дело группировать студентов по возрасту, который в этом случае варьирует в пределах от 17 до 35 лет, для изучения влияния возраста на успеваемость, а другое – группировать рабочих по возрасту, который колеблется от 16 до 60 лет и более, для анализа влияния возраста на производительность труда. Вполне понятно, что для второго случая требуется больше групп даже при одном и том же количестве единиц совокупности. К тому же рабочие по возрасту распределяются иначе, чем студенты. На практике число групп определяется с учетом объема совокупности, размаха вариации и теоретических соображений о форме распределения, либо соображений базирующихся на прошлом опыте или предварительных пробных группировках, которые не требуют большого труда, когда совокупность измеряется десятками или сотнями единиц. Возможно применение в таких случаях и неравных интервалов, если в этом есть надобность. Но при неравных интервалах сила влияния факторного признака на результат определяется межгрупповыми разностями результативного признака, отнесенного не на единицу факторного признака, а на единицу разницы между средними значениями факторного признака. Например, если бы в примере с группировкой студентов по возрасту интервал первой группы составил 17-19 лет, второй группы 20-24 года, а средний балл успеваемости соответственно 3,8 и 4,2 балла, то влияние возраста на успеваемость определялось бы так:

4,2-3,8 0,4

---------------- = ------- = 0,1. Это значило бы, что с увеличением возраста

22-18 4

студентов на один год успеваемость повышается в среднем на 0,1 балла.

Методу равных интервалов, как и методу определения числа групп по формуле Стерджесса, свойственен и такой недостаток. При нормальном распределении они приводят к тому, что в крайние группы попадает недостаточное количество единиц совокупности для того, чтобы получить достоверные результаты. Это особенно важно при малых совокупностях. Сравнение же крайних групп обычно представляет наибольший интерес. Сказанное относится не только к нормальному распределению. В частности, в примере с распределением студентов по возрасту совсем мало студентов окажется в группах старше 25 лет. Поэтому практически при малых интервалах в аналитических группировках нужно стараться подобрать такие интервалы, чтобы общее число единиц совокупности распределялось по группам более или менее равномерно. Если довести этот принцип до логического конца, то он приводит к методу, который называется методом равных частот.

По методу равных частот совокупность расчленяется на группы таким образом, чтобы в каждую группу попало одинаковое количество единиц совокупности, что исключает возможность образования групп с незначительным количеством единиц. Это важно для обеспечения достоверности групповых характеристик результативного признака в равной мере по всем группам, включая и характеристики крайних групп, что особенно важно. Основным недостатком этого метода является то, что при равных частотах образуются неравные интервалы, что затрудняет определение влияния фактора на результативный показатель. Тем не менее метод равных частот не получил широкого распространения в статистических работах.

Все сказанное выше о группировках относится к группировкам, которые производятся на основе первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. В таких случаях производится обычно перегруппировка для образования новых групп на основании уже имеющейся группировки. Образование новых групп на основании уже имеющейся группировки называется вторичной группировкой.

В результате группировки единиц совокупности по величине какого-нибудь варьирующего признака получают ряды распределения.

Ряд распределения – это первичная характеристика массовой статистической совокупности, в которой находят количественное выражение закономерности вариации массовых явлений и процессов общественной жизни. Ряды распределения дают возможность судить о закономерности распределения и о границах варьирования совокупности. Различные обобщающие показатели (средние, мода, медиана, дисперсия и т.д.) исчисляются на основе ряда распределения.

Ряды распределения состоят из вариантов (групп по выделенному признаку) и частот (численности групп). Частоты, выраженные в виде относительных величин (долях единицы, процентах) называются частостями. Сумма всех частот называется объемом ряда распределения или его численностью.

Ряды распределения могут быть образованы как по атрибутивным признакам (например, распределение населения по полу), так и по количественным (например, распределение населения по возрасту). В соответствии с этим они делятся на атрибутивные и вариационные ряды распределения.

Вариационные ряды, как и статистические количественные признаки, подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных признаках, интервальные – на непрерывных признаках, либо на дискретных признаках, представленных в виде интервалов.

 

 

Тема 4. Абсолютные и относительные величины.

1. Абсолютные величины, их виды и единицы измерения.








Дата добавления: 2015-04-29; просмотров: 1118;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.018 сек.