Корреляционный момент, коэффициент корреляции

Особую роль играет центральный смешанный момент второго порядка , называемый корреляционным моментом или моментом связи.

Корреляционным моментом (или ковариацией) двух случайных величин X и Y называется математическое ожидание произведения отклонений этих случайных величин от их математических ожиданий и обозначается через или .

Таким образом, по определению

. (6.28)

 

При этом: если - дискретная двумерная случайная величина, то ковариация вычисляется по формуле

, (6.29)

если - непрерывная двумерная случайная величина, то

. (6.30)

 

Ковариацию часто удобно вычислять по формуле

. (6.31)

 

Формулу (6.30) можно записать в виде

. (6.32)

 

Свойства ковариации:

1. Ковариация симметрична, т.е.

.

2. Дисперсия случайной величины, есть ковариация ее с самой собой, т.е.

, .

3. Если случайные величины X и Y независимы, то

4. Дисперсия суммы (разности) двух случайных величин равна сумме их дисперсий плюс (минус) удвоенная ковариация этих случайных величин, т. е.

.

5. Постоянный множитель можно вынести за знак ковариаций, т.е.

или .

6. Ковариация не изменится, если к одной из случайных величин (или к обоим сразу) прибавить постоянную, т.е.

или

.

7. Ковариация двух случайных величин по абсолютной величине не превосходит их среднего квадратического отклонения, т.е.

.

Из свойства 3 следует, что если , то случайные величины Х и Y зависимы. Случайные величины Х и Y в этом случае ( ) называют коррелированными. Однако из того, что , не следует независимость случайных величин Х и Y. В этом случае случайные величины Х и Y называют некоррелированными. Из независимости вытекает некоррелированность; обратное не верно.

Из свойств ковариации следует, что она ( ) характеризует и степень зависимости случайных величин, и их рассеяние вокруг точки . Размерность ковариации равна произведению размерностей случайных величин Х и Y. В качестве числовой характеристики зависимости (а не рассеяния) случайных величин Х и Y берут безразмерную величину – коэффициент корреляции. Он является лучшей оценкой степени влияния одной случайной величины на другую.

Коэффициентом корреляции двух случайных величин Х и Y называют отношение их ковариации (корреляционного момента) к произведению их средних квадратических отклонений:

. (6.33)

 

Очевидно, коэффициент корреляции равен ковариации стандартных случайных величин и , т.е.

Свойствакоэффициента корреляции:

1. Коэффициент корреляции по абсолютной величине не превосходит 1, т.е.

или .

2. Если Х и Y независимы, то

.

3. Если Х и Y связаны линейной зависимостью , , то

,

причем при , при .

4. Если , то случайные величины Х и Y связаны линейной функциональной зависимостью.

 

Итак, для независимых случайных величин , для линейно связанных , а в остальных случаях .

Говорят, что случайные величины связаны положительной корреляцией, если , а если - отрицательной корреляцией. Чем ближе к единице, тем больше оснований считать, что X и Y связаны линейной зависимостью. Отметим, что корреляционные моменты и дисперсии системы случайных величин обычно задаются корреляционной матрицей:

или .   (6.34)

 

Пример 6.6.Закон распределения дискретной двумерной случайной величины задан таблицей:

-1
0,15 0,40 0,05
0,20 0,10 0,10

Найти коэффициент корреляции .

Решение:

Находим законы распределения составляющих X и Y:

 

Х       Y -1
Р 0,6 0,4       р 0,35 0,50 0,15

 

Найдем математические ожидания составляющих:

,

(их можно было найти и по формуле (6.20)).

 

Находим дисперсии составляющих:

,

.

Тогда , .

 

Находим MХY, используя формулу (6.26):

(Можно было составить закон распределения Z=XY, а затем найти MZ=MXY:

 

Z=XY -1
p 0,20 0,70 0,10

).

 

Находим корреляционный момент, используя формулу (6.31):

.

 

Находим коэффициент корреляции по формуле (6.33):

- отрицательная корреляция.

 

Двумерное нормальное распределение

 

Среди законов распределения двумерной случайной величины на практике чаще всего встречается нормальное (гауссовское) распределение вероятностей. Оно применяется, в частности, для описания 2-х результатов измерения, абсциссы и ординаты точки попадания при стрельбе и т.д.

Двумерная случайная величина называется распределенной по нормальному закону, если ее совместная плотность имеет вид

,   (6.35)

где mх, mу, σх, σу, - параметры этого распределения.

Распределение (6.35) называется также нормальным законом распределения на плоскости или двумерным нормальным (гауссовским) распределением.

Можно доказать, что - это функция плотности, т.е. справедливо равенство

,

mx = MX, my = MY; σx и σy - средние квадратические отклонения; r - коэффициент корреляции случайных величин X и Y.

Это означает, что двумерное нормальное распределение полностью определяется заданием его числовых характеристик, что удобно на практике (опытным путем находят эти параметры-характеристики и получают совместную плотность двух нормально распределенных случайных величин X и У).

Выясним смысл параметров и , найдя распределение вероятностей составляющих Х (т.е. плотность вероятностей одномерной случайной величины Х).

Согласно (6.10) имеем:

.   (6.36)

 

Случайная величина Х имеет нормальное распределение с математическим ожиданием и дисперсией . Аналогично получаем

,   (6.37)

т.е. .

График плотности нормально распределенной двумерной случайной величины представляет собой холмообразную поверхность, вершина которой находится в точке , т.е. максимум функции достигается в точке (рис. 5.13, гл.V).

Если компоненты двумерной нормально распределенной случайной величины некоррелированы , то функция плотности (6.35) принимает вид

,   (6.38)

т.е.

,

где - плотность распределения случайной величины Х, - случайной величины Y.

Следовательно, некоррелированные нормально распределенные случайные величины являются также и независимыми, и наоборот. Таким образом, для нормально распределенных случайных величин термины «независимость» и «некоррелированность» эквивалентны.

 

Утверждение. Если случайные величины Х и Y независимы, то вероятность попадания случайной точки , распределенной по нормальному закону в прямоугольник , находится по формуле:

,

где - функция Лапласа.

 

Произвольную область D можно приближенно заменить областью, составленной из прямоугольников. На этом основано применение так называемых «сеток рассеивания».

 

Пример 6.7. Найти вероятность попадания точки в прямоугольник , если плотность совместного распределения случайных величин Х и Y равна .

Решение:

Функцию можно переписать в виде

Значит Х и Y независимы и .

Поэтому .

 








Дата добавления: 2017-03-29; просмотров: 1019;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.025 сек.