Корреляционный момент, коэффициент корреляции
Особую роль играет центральный смешанный момент второго порядка
, называемый корреляционным моментом или моментом связи.
Корреляционным моментом (или ковариацией) двух случайных величин X и Y называется математическое ожидание произведения отклонений этих случайных величин от их математических ожиданий и обозначается через
или
.
Таким образом, по определению
.
| (6.28) |
При этом: если
- дискретная двумерная случайная величина, то ковариация вычисляется по формуле
,
| (6.29) |
если
- непрерывная двумерная случайная величина, то
.
| (6.30) |
Ковариацию часто удобно вычислять по формуле
.
| (6.31) |
Формулу (6.30) можно записать в виде
.
| (6.32) |
Свойства ковариации:
1. Ковариация симметрична, т.е.
.
2. Дисперсия случайной величины, есть ковариация ее с самой собой, т.е.
,
.
3. Если случайные величины X и Y независимы, то

4. Дисперсия суммы (разности) двух случайных величин равна сумме их дисперсий плюс (минус) удвоенная ковариация этих случайных величин, т. е.
.
5. Постоянный множитель можно вынести за знак ковариаций, т.е.
или
.
6. Ковариация не изменится, если к одной из случайных величин (или к обоим сразу) прибавить постоянную, т.е.

или
.
7. Ковариация двух случайных величин по абсолютной величине не превосходит их среднего квадратического отклонения, т.е.
.
Из свойства 3 следует, что если
, то случайные величины Х и Y зависимы. Случайные величины Х и Y в этом случае (
) называют коррелированными. Однако из того, что
, не следует независимость случайных величин Х и Y. В этом случае случайные величины Х и Y называют некоррелированными. Из независимости вытекает некоррелированность; обратное не верно.
Из свойств ковариации следует, что она (
) характеризует и степень зависимости случайных величин, и их рассеяние вокруг точки
. Размерность ковариации равна произведению размерностей случайных величин Х и Y. В качестве числовой характеристики зависимости (а не рассеяния) случайных величин Х и Y берут безразмерную величину – коэффициент корреляции. Он является лучшей оценкой степени влияния одной случайной величины на другую.
Коэффициентом корреляции
двух случайных величин Х и Y называют отношение их ковариации (корреляционного момента) к произведению их средних квадратических отклонений:
.
| (6.33) |
Очевидно, коэффициент корреляции равен ковариации стандартных случайных величин
и
, т.е. 
Свойствакоэффициента корреляции:
1. Коэффициент корреляции по абсолютной величине не превосходит 1, т.е.
или
.
2. Если Х и Y независимы, то
.
3. Если Х и Y связаны линейной зависимостью
,
, то
,
причем
при
,
при
.
4. Если
, то случайные величины Х и Y связаны линейной функциональной зависимостью.
Итак, для независимых случайных величин
, для линейно связанных
, а в остальных случаях
.
Говорят, что случайные величины связаны положительной корреляцией, если
, а если
- отрицательной корреляцией. Чем ближе
к единице, тем больше оснований считать, что X и Y связаны линейной зависимостью. Отметим, что корреляционные моменты и дисперсии системы случайных величин обычно задаются корреляционной матрицей:
или .
| (6.34) |
Пример 6.6.Закон распределения дискретной двумерной случайной величины задан таблицей:
| -1 | ||
| 0,15 | 0,40 | 0,05 | |
| 0,20 | 0,10 | 0,10 |
Найти коэффициент корреляции
.
Решение:
Находим законы распределения составляющих X и Y:
| Х | Y | -1 | |||||||
| Р | 0,6 | 0,4 | р | 0,35 | 0,50 | 0,15 |
Найдем математические ожидания составляющих:
,

(их можно было найти и по формуле (6.20)).
Находим дисперсии составляющих:
,
.
Тогда
,
.
Находим MХY, используя формулу (6.26):

(Можно было составить закон распределения Z=XY, а затем найти MZ=MXY:
| Z=XY | -1 | ||
| p | 0,20 | 0,70 | 0,10 |
).
Находим корреляционный момент, используя формулу (6.31):
.
Находим коэффициент корреляции по формуле (6.33):
- отрицательная корреляция.
Двумерное нормальное распределение
Среди законов распределения двумерной случайной величины
на практике чаще всего встречается нормальное (гауссовское) распределение вероятностей. Оно применяется, в частности, для описания 2-х результатов измерения, абсциссы и ординаты точки попадания
при стрельбе и т.д.
Двумерная случайная величина
называется распределенной по нормальному закону, если ее совместная плотность
имеет вид
,
| (6.35) |
где mх, mу, σх, σу,
- параметры этого распределения.
Распределение (6.35) называется также нормальным законом распределения на плоскости или двумерным нормальным (гауссовским) распределением.
Можно доказать, что
- это функция плотности, т.е. справедливо равенство
,
mx = MX, my = MY; σx и σy - средние квадратические отклонения; r - коэффициент корреляции случайных величин X и Y.
Это означает, что двумерное нормальное распределение полностью определяется заданием его числовых характеристик, что удобно на практике (опытным путем находят эти параметры-характеристики и получают совместную плотность
двух нормально распределенных случайных величин X и У).
Выясним смысл параметров
и
, найдя распределение вероятностей составляющих Х (т.е. плотность вероятностей одномерной случайной величины Х).
Согласно (6.10) имеем:
.
| (6.36) |
Случайная величина Х имеет нормальное распределение с математическим ожиданием
и дисперсией
. Аналогично получаем
,
| (6.37) |
т.е.
.
График плотности
нормально распределенной двумерной случайной величины
представляет собой холмообразную поверхность, вершина которой находится в точке
, т.е. максимум функции
достигается в точке
(рис. 5.13, гл.V).
Если компоненты двумерной нормально распределенной случайной величины
некоррелированы
, то функция плотности (6.35) принимает вид
,
| (6.38) |
т.е.
,
где
- плотность распределения случайной величины Х,
- случайной величины Y.
Следовательно, некоррелированные нормально распределенные случайные величины являются также и независимыми, и наоборот. Таким образом, для нормально распределенных случайных величин термины «независимость» и «некоррелированность» эквивалентны.
Утверждение. Если случайные величины Х и Y независимы, то вероятность попадания случайной точки
, распределенной по нормальному закону в прямоугольник
, находится по формуле:
,
где
- функция Лапласа.
Произвольную область D можно приближенно заменить областью, составленной из прямоугольников. На этом основано применение так называемых «сеток рассеивания».
Пример 6.7. Найти вероятность попадания точки
в прямоугольник
, если плотность совместного распределения случайных величин Х и Y равна
.
Решение:
Функцию
можно переписать в виде

Значит Х и Y независимы и
.
Поэтому
.
Дата добавления: 2017-03-29; просмотров: 1279;

.
,
.
.
.
.
или
.
,
.
,
,