Показатели вариации
Понятие вариации
Вариация— это наличие различий у отдельных единиц совокупности по какому-либо признаку.
Эта категория занимает особое место в статистической науке, ибо именно наличие вариации единиц совокупности предопределяет необходимость статистики. Если бы отдельные единицы совокупности имели они и те же значения признаков (например, рост, возраст у всех живущих людей был бы одинаковый), то для изучения данной совокупности по этим признакам достаточно было бы изучить только одну единицу совокупности. Однако зачастую значения признаков колеблются, изменяются при переходе от одной единицы к другой. Как правило, вариация является порождением следующих причин:
— своеобразие условий, в которых происходит развитие отдельных единиц совокупности;
— неравномерность развития отдельных единиц.
Например, причиной вариации роста у отдельно взятых людей является генетическая особенность каждого организма (основная причина), особенности питания, экологическая обстановка и т.д.; вариация урожайности может быть вызвана климатическими, почвенными особенностями зоны произрастания, режима и возможности полива, качеством посадочного материала и т.д.
Вариация существует во времени и в пространстве.
Под вариацией в пространстве понимается колеблемость значений признака по отдельным территориям (урожайность пшеницы в разных регионах).
Под вариацией во времени подразумевается объективное изменение значений признака в разные периоды (или моменты). Например, со временем изменяется средняя продолжительность предстоящей жизни, доходность предприятий отрасли, уровень потребностей людей и т.д.
Изучение вариации имеет важное значение, так как вариация характеризует степень однородности совокупности. Однородность совокупности — необходимое условие при расчете большинства статистических показателей, в частности средних величин.
Показатели вариации
Показатели вариации являются необходимым дополнением при расчете средних величин, так как определяют степень однородности совокупности.
Система показателей вариациивключает следующее:
— размах вариации;
— среднее абсолютное (линейное) отклонение;
— среднее квадратическое отклонение;
— дисперсия;
— коэффициент вариации.
Значение показателей вариации:
— характеризуются размеры вариации признака;
— показатели вариации дополняют систему средних величин, в которой затушевываются индивидуальные различия;
— показатели вариации позволяют охарактеризовать уровень однородности совокупности;
— с помощью показателей вариации, путем сравнения вариации у отдельных признаков (разных), есть возможность измерить взаимосвязь между этими признаками.
Первый показатель, так называемый размах вариации,— наиболее простой из показателей, характеризует абсолютные размеры изменения признака и определяется как разница максимального и минимального значений признака:
Несмотря на простоту расчета, этот показатель имеет важный недостаток — учитывает только два приграничных значения. В случае аномальности одного или двух приграничных значений, он может исказить действительную вариацию совокупности.
Для того чтобы избавиться от этого недостатка, рассчитывают отклонение каждой индивидуальной величины от средней по совокупности. Таким образом, учитывается значение каждой единицы совокупности. Для того чтобы охарактеризовать это отклонение одним числом, рассчитывают среднюю из этих значений. Данный показатель носит название среднее абсолютное (линейное) отклонениеи определяется следующим образом:
- простой вид;
- взвешенный вид (для сгруппированных данных);
где d(L) — среднее абсолютное (линейное) отклонение;
х — индивидуальное значение признака (варианта);
— среднее из значений признака;
п — численность совокупности;
f — частота.
Среднее линейное отклонениехарактеризует средний размер отклонений индивидуальных значений признака от средней величины. Таким образом, он характеризует абсолютные размеры вариации, имеет те же единицы измерения, что и признак, вариацию которого характеризует.
Недостаток: ввиду того, что применяется модуль, затруднено проведение математических операций. Поэтому он применяется редко.
Для того чтобы избавиться от недостатка предыдущего показателя, разницу между индивидуальным значением и средней возведем в квадрат и затем извлечем корень квадратный из полученного среднего значения. Полученный показатель будет называться среднее квадратическое отклонение:
- простая.
- взвешенная.
Играет ту же роль, что и среднее абсолютное отклонение, но, имеет перед ним одно преимущество, а именно, с ним проще проводить математические операции. Ввиду этого в 90 случаях из 100 используется этот показатель.
Еще более удобный для математических преобразований показатель вариации — дисперсия,который представляет собой среднее квадратическое отклонение в квадрате:
- простая,
- взвешенная.
С помощью дисперсии и среднего квадратического отклонения измеряются взаимосвязи между различными признаками. Кроме того, по этим показателям можно сравнивать совокупности в смысле их однородности по одинаковым признакам.
Вывод об однородности совокупности позволяет сделать коэффициент вариации, который может быть рассчитан несколькими способами в зависимости от исходной информации:
- характеризует средний процент отклонений индивидуальных значений признака от средней величины.
,
,
,
где V – коэффициент вариации;
σ – среднее квадратическое отклонение;
d (L) – среднее линейное отклонение;
ХМО – мода (структурная средняя);
ХМЕ – медиана(структурная средняя).
Коэффициент вариации имеет большое значение. Он позволяет сравнивать уровень вариации по различным признакам и используется для характеристики однородности совокупности. Если коэффициент вариации меньше 33%, то совокупность однородна.
Пример расчета показателей вариации.
Распределение студентов вуза по возрасту характеризуются следующими данными (табл. 1):
Таблица 1
Возраст студентов, лет | Число студентов очно-заочного отделения, чел. | Число студентов дневной формы обучения, чел. | Хi,лет |
17—20 | 12,5 | ||
20—23 | 21,5 | ||
23—25 | 24,0 | ||
25—28 | 26,5 | ||
28—30 | 29,0 | ||
30 и старше | 31,0 |
Рассчитайте показатели, характеризующие вариацию возраста студентов для каждой формы
обучения. Сравните полученные результаты.
Рассчитаем показатели вариации, характеризующие совокупность студентов очно-заочной формы
обучения.
1. Размах вариации:
R = xmax – xmin = 31 - 18,5 = 12,5 (лет)
2. Средняя арифметическая:
3. Среднее линейное отклонение:
Возраст отдельно взятого студента отклоняется от среднего по совокупности возраста — 27 лет — на 3 года. То есть можно утверждать, что возраст наибольшего числа студентов не будет выходить за границы интервала: от 24,3 до 30,4 лет.
27,36 - 3,07 < 27,36 < 27,36+ 3,07.
Среднее квадратическое отклонение:
Среднее квадратическое отклонение также характеризует абсолютную величину отклонения индивидуального значения от средней. Как правило, значение среднего квадратического отклонения больше среднего линейного отклонения.
Дисперсия:
=13,899
Характеризует квадрат отклонений индивидуального значения от средней величины. Коэффициент вариации:
Средний процент отклонений индивидуальных значений от средней величины составляет 13,6%. Совокупность однородна. Сделаем аналогичные расчеты по совокупности студентов дневного отделения. Получаем следующие результаты:
R = 12,5
= 21,69
d(L) = 3,40
σ = = 4,74
σ2=22,54
V = 21,9%
На основании приведенных расчетов можно сделать вывод о том, что совокупность студентов очно-заочного отделения более однородная.
Расчет показателей вариации — достаточно трудоемкий процесс. В некоторых случаях, когда имеется ряд показателей с равноотстоящими моментами времени или равноинтервальный ряд распределения, расчет может быть упрощен. Сокращенные способы расчета дисперсии базируются на знании свойств дисперсии. Свойства дисперсии:
— если от всех значений варианты х отнять (прибавить) постоянное число А, то дисперсия не изменится;
— если каждое значение варианты разделить (умножить) на постоянную величину к, то дисперсия уменьшится (увеличится) в к2 раз.
Сокращенные способы расчета дисперсии:
1.
2. Способ моментов – применяется только в случае равенства интервалов.
, где i – величина интервала;
- момент 2-го порядка, , где х′ - момент 1-го порядка.
Пример.
Имеются следующие данные о распределении семей по уровню среднедушевого дохода (табл. 2).
Таблица 2
Средний душевой доход, руб. | Число семей в группе | х, | х' | x'f | x'2f |
До 200 | -4 | -40 | |||
200—300 | -3 | -105 | |||
300-400 | -2 | -136 | |||
400—500 | -1 | -70 | |||
500—600 | |||||
700—800 | |||||
800 и более | |||||
Итого | -297 |
Как правило, в качестве константы А выбирается варианта с наибольшей частотой (для максимального упрощения расчетов). Наибольшая частота равна 75, значит А = 550.
.
На основании приведенных расчетов можно сделать вывод о том, что совокупность семей однородна. Однако коэффициент вариации приближается к верхней границе (33%), превышение которой свидетельствует о неоднородности совокупности. То есть в данной совокупности достаточно высокий уровень вариации. Средний душевой доход по всей совокупности семей составляет 451руб., а среднее отклонение от этого уровня — 141 руб. Поэтому можно констатировать достаточно высокую разницу между уровнем дохода отдельно взятых семей и, как следствие этого — начавшийся процесс расслоения общества. Дополнительные выводы можно сделать, рассчитав структурные средние — моду и медиану.
Дата добавления: 2016-12-16; просмотров: 5483;