Коэффициент корреляции. Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции .
Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции .
Коэффициент корреляции между двумя случайными величинами и
вычисляется по формуле:
,
где ,
- средние квадратические отклонения случайных величин
соответственно.
Отметим некоторые свойства коэффициента корреляции:
1. Если независимые случайные величины, то коэффициент корреляции равен нулю.
2. Коэффициент корреляции принимает значения на отрезке , то есть
. В зависимости от того, насколько
приближается к 1, в математической статистике различают (шкала Шеддока): связи нет (
), связь слабую (
), умеренную (
), тесную
и очень тесную
.
3. Если , то между случайными величинами
имеет место функциональная, а именно линейная зависимость.
4. Коэффициент корреляции указывает на направление связи. Если , то связь прямая, если
отрицателен, то это свидетельствует о наличии обратной связи.
Квадрат коэффициента корреляции называется коэффициентом детерминации:
.
Коэффициент детерминации показывает, какая часть общей вариации
обусловлена вариацией
.
Пример 15. С целью анализа влияния заработной платы на текучесть рабочей силы на пяти однотипных предприятиях проведены измерения уровня зарплаты (тыс.руб.) и числа уволившихся за год рабочих
:
![]() | 5,5 | ||||
![]() |
Определить степень влияния заработной платы на текучесть рабочей силы.
Решение.
Для определения тесноты связи вычислим коэффициент корреляции, для чего составим расчетную таблицу:
![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
5,5 | 30,25 | ||||
![]() | 23,5 | 116,25 |
Так как коэффициент корреляции рассчитывается по формуле
, то:
1. Найдем средние значения: (сумма значений второго столбца, деленная на число строк:
;
среднее значение (сумма значений третьего столбца, деленная на число строк):
;
среднее значение (среднее значение шестого столбца):
.
2. Найдем средние квадратические отклонения :
где рассчитывается как среднее значение четвертого столбца.
Аналогично ,
где - среднее значение пятого столбца.
3. Подставляя найденные значения в формулу коэффициента корреляции, получим:
.
Таким образом, можно сделать вывод, что связь между заработной платой и текучестью рабочей силы очень тесная и обратная, так как полученный коэффициент корреляции отрицательный. Это говорит о том, что чем меньше заработная плата ( ), тем больше число уволившихся.
Выясним, какая часть вариации обусловлена вариацией
. Вычислим коэффициент детерминации:
.
То есть вариации текучести рабочей силы ( ) на 92% обусловлена вариацией заработной платы (
).
Дата добавления: 2016-04-22; просмотров: 1548;