Корреляционный момент, коэффициент корреляции

Особую роль играет центральный смешанный момент второго порядка , называемый корреляционным моментом или моментом связи.

Корреляционным моментом (или ковариацией) двух случайных величин X и Y называется математическое ожидание произведения отклонений этих случайных величин от их математических ожиданий и обозначается через или .

Таким образом, по определению

(6.28)

При этом: если - дискретная двумерная случайная величина, то ковариация вычисляется по формуле

(6.29)

если - непрерывная двумерная случайная величина, то

(6.30)

Ковариацию часто удобно вычислять по формуле

(6.31)

Формулу (6.30) можно записать в виде

(6.32)

Свойства ковариации:

1. Ковариация симметрична, т.е.

2. Дисперсия случайной величины, есть ковариация ее с самой собой, т.е.

, .

3. Если случайные величины X и Y независимы, то

4. Дисперсия суммы (разности) двух случайных величин равна сумме их дисперсий плюс (минус) удвоенная ковариация этих случайных величин, т. е.

5. Постоянный множитель можно вынести за знак ковариаций, т.е.

или .

6. Ковариация не изменится, если к одной из случайных величин (или к обоим сразу) прибавить постоянную, т.е.

или

7. Ковариация двух случайных величин по абсолютной величине не превосходит их среднего квадратического отклонения, т.е.

Из свойства 3 следует, что если , то случайные величины Х и Y зависимы. Случайные величины Х и Y в этом случае ( ) называют коррелированными. Однако из того, что , не следует независимость случайных величин Х и Y. В этом случае случайные величины Х и Y называют некоррелированными. Из независимости вытекает некоррелированность; обратное не верно.

Из свойств ковариации следует, что она ( ) характеризует и степень зависимости случайных величин, и их рассеяние вокруг точки . Размерность ковариации равна произведению размерностей случайных величин Х и Y. В качестве числовой характеристики зависимости (а не рассеяния) случайных величин Х и Y берут безразмерную величину – коэффициент корреляции. Он является лучшей оценкой степени влияния одной случайной величины на другую.

Коэффициентом корреляции двух случайных величин Х и Y называют отношение их ковариации (корреляционного момента) к произведению их средних квадратических отклонений:

(6.33)

Очевидно, коэффициент корреляции равен ковариации стандартных случайных величин и , т.е.

Свойствакоэффициента корреляции:

1. Коэффициент корреляции по абсолютной величине не превосходит 1, т.е.

или .

2. Если Х и Y независимы, то

.

3. Если Х и Y связаны линейной зависимостью , , то

,

причем при , при .

4. Если , то случайные величины Х и Y связаны линейной функциональной зависимостью.

Итак, для независимых случайных величин , для линейно связанных , а в остальных случаях .

Говорят, что случайные величины связаны положительной корреляцией, если , а если - отрицательной корреляцией. Чем ближе к единице, тем больше оснований считать, что X и Y связаны линейной зависимостью. Отметим, что корреляционные моменты и дисперсии системы случайных величин обычно задаются корреляционной матрицей:

или . (6.34)

Пример 6.6.Закон распределения дискретной двумерной случайной величины задан таблицей:

-1

0,15 0,40 0,05

0,20 0,10 0,10

Найти коэффициент корреляции .

Решение:

Находим законы распределения составляющих X и Y:

Х Y -1

Р 0,6 0,4 р 0,35 0,50 0,15

Найдем математические ожидания составляющих:

,

(их можно было найти и по формуле (6.20)).

Находим дисперсии составляющих:

,

.

Тогда , .

Находим MХY, используя формулу (6.26):

(Можно было составить закон распределения Z=XY, а затем найти MZ=MXY:

Z=XY -1

p 0,20 0,70 0,10

).

Находим корреляционный момент, используя формулу (6.31):

.

Находим коэффициент корреляции по формуле (6.33):

- отрицательная корреляция.

Двумерное нормальное распределение

Среди законов распределения двумерной случайной величины на практике чаще всего встречается нормальное (гауссовское) распределение вероятностей. Оно применяется, в частности, для описания 2-х результатов измерения, абсциссы и ординаты точки попадания при стрельбе и т.д.

Двумерная случайная величина называется распределенной по нормальному закону, если ее совместная плотность имеет вид

(6.35)

где m_х, m_у, σ_х, σ_у, - параметры этого распределения.

Распределение (6.35) называется также нормальным законом распределения на плоскости или двумерным нормальным (гауссовским) распределением.

Можно доказать, что - это функция плотности, т.е. справедливо равенство

m_x = MX, m_y = MY; σ_x и σ_y - средние квадратические отклонения; r - коэффициент корреляции случайных величин X и Y.

Это означает, что двумерное нормальное распределение полностью определяется заданием его числовых характеристик, что удобно на практике (опытным путем находят эти параметры-характеристики и получают совместную плотность двух нормально распределенных случайных величин X и У).

Выясним смысл параметров и , найдя распределение вероятностей составляющих Х (т.е. плотность вероятностей одномерной случайной величины Х).

Согласно (6.10) имеем:

(6.36)

Случайная величина Х имеет нормальное распределение с математическим ожиданием и дисперсией . Аналогично получаем

(6.37)

т.е. .

График плотности нормально распределенной двумерной случайной величины представляет собой холмообразную поверхность, вершина которой находится в точке , т.е. максимум функции достигается в точке (рис. 5.13, гл.V).

Если компоненты двумерной нормально распределенной случайной величины некоррелированы , то функция плотности (6.35) принимает вид

(6.38)

т.е.

где - плотность распределения случайной величины Х, - случайной величины Y.

Следовательно, некоррелированные нормально распределенные случайные величины являются также и независимыми, и наоборот. Таким образом, для нормально распределенных случайных величин термины «независимость» и «некоррелированность» эквивалентны.

Утверждение. Если случайные величины Х и Y независимы, то вероятность попадания случайной точки , распределенной по нормальному закону в прямоугольник , находится по формуле:

где - функция Лапласа.

Произвольную область D можно приближенно заменить областью, составленной из прямоугольников. На этом основано применение так называемых «сеток рассеивания».

Пример 6.7. Найти вероятность попадания точки в прямоугольник , если плотность совместного распределения случайных величин Х и Y равна .

Решение:

Функцию можно переписать в виде

Значит Х и Y независимы и .

Поэтому .

<4 5 678 9 10 >

Дата добавления: 2017-03-29; просмотров: 1356;