Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
Мы ввели в рассмотрение числовые характеристики одной случайной величины Х - начальные и центральные моменты различных порядков. Из этих характеристик важнейшими являются две: математическое ожидание mx и дисперсия Dx.
Аналогичные числовые характеристики - начальные и центральные моменты различных порядков - можно ввести и для системы двух случайных величин. Начальным моментом порядка k, s системы (X, Y) называется математическое ожидание произведения Хk на Ys:
M[Хk Ys]
Центральным моментом порядка k, s системы (X, Y) называется математическое ожидание произведения k-й и s-й степени соответствующих центрированных величин:
На практике обычно применяются только первые и вторые моменты.
Первые начальные моменты представляют собой уже известные нам математические ожидания величин Х и Y, входящих в систему:
mx и my
Совокупность математических ожиданий mx, my представляет собой характеристику положения системы. Геометрически это координаты средней точки на плоскости, вокруг которой происходит рассеивание точки (X. Y).
Кроме первых начальных моментов, на практике широко применяются еще, вторые центральные моменты системы. Два из них представляют собой уже известные нам дисперсии величин Х и Y.
D[X] и D [Y], характеризующие рассеивание случайной точки в направлении осей Ох а Оу.
Особую роль как характеристика системы играет второй смешанный центральный момент:
μ1,1 = М [X Y],
т. е. математическое ожидание произведения центрированных величин. Ввиду того, что этот момент играет важную роль в теории систем случайных величин для него введено особое обозначение:
Кху =М[Х0 Y0]=M[(X—mx)(Y— my)].
Характеристика Кxy называется корреляционным моментом (иначе — «моментом связи») случайных величин X, Y.
Для дискретных случайных величин корреляционный момент выражается формулой
Кху =Σ Σ(xi-mx)(yj-my) pij
i j
Выясним смысл и назначение этой характеристики. Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо рассеивания величин Х и Y, еще и связь между ними. Для независимых случайных величин корреляционный момент равен нулю.
Таким образом, если корреляциснный момент двух случайных величин отличен от нуля, это есть признак наличия зависимости между ними.
Из формулы видно, что корреляционный момент характеризует не только зависимость величин, но и их рассеивание. Действительно, если, например, одна из величин (X, Y) весьма мало отклоняется от своего математического ожидания (почти не случайна), то корреляционный момент будет мал, какой бы тесной зависимостью ни были связаны величины (X, Y). Поэтому для характеристики связи между величинами (X, Y) в чистом виде переходят от момента к безразмерной характеристике
rху=Кху/σх σу
где σх, σу - средние квадратические отклонения величин X, Y. Эта характеристика называется коэффициентом корреляции величин Х и Y.
Очевидно, коэффициент корреляции обращается в нуль одновременно с корреляционным моментом; следовательно, для независимых случайных величин коэффициент корреляции равен нулю.
Случайные величины, для которых корреляционный момент (а значит, и коэффициент корреляции) равен нулю, называются некоррелированными (иногда — «несвязанными»).
Эквивалентно ли понятие некоррелированности случайных величин понятию независимости. Известно, что независимые случайные величины всегда являются некоррелированными. Остается выяснить: справедливо ли обратное положение, вытекает ли из некоррелированности величин их независимость? Оказывается - нет. Существуют такие случайные величины, которые являются некоррелированными, но зависимыми. Равенство нулю коэффициента корреляции - необходимое, но не достаточное условие независимости случайных величин. Из независимости случайных величин вытекает их некоррелированность; напротив, из некоррелированности величии еще не следует их независимость. Условие независимости случайных величин—более жесткое, чем условие некоррелированности.
Коэффициент корреляции характеризует не всякую зависимость, а только так называемую линейную зависимость. Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или же убывать) по линейному закону. Эта тенденция к линейной зависимости может быть более или менее ярко выраженной, более или менее приближаться к функциональной, т. е. самой тесной линейной зависимости. Коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами. Если случайные величины Х и Y связаны точной линейной функциональной зависимостью:
У=аХ + в, то rху = ±1, причем знак «плюс» или «минус» берется в зависимости от того, положителен или отрицателен коэффициент а. В общем случае, когда величины Х и Y связаны произвольной вероятностной зависимостью, коэффициент корреляции может иметь значение в пределах:
- 1 < rху < 1
В случае r > 0 говорят о положительной корреляции величин Х и Y, в случае г<0 - об отрицательной корреляции. Положительная корреляция между случайными величинами означает, что при возрастании одной из них другая имеет тенденцию в среднем возрастать; отрицательная корреляция означает, что при возрастании одной из случайных величин другая имеет тенденцию в среднем убывать.
Приведем несколько примеров случайных величин с положительной и отрицательной корреляцией.
1.Вес и рост человека связаны положительной корреляцией.
2.Время, потраченное на подготовку к занятиям, и полученная оценка связаны положительной корреляцией (если, разумеется, время потрачено разумно). Наоборот, время, потраченное на подготовку, и количество полученных двоек, связаны отрицательной корреляцией.
3. Производится два выстрела по цели; точка попадания первого выстрела регистрируется, и в прицел вводится поправка, пропорциональная ошибке первого выстрела с обратным знаком. Координаты точек попадания первого и второго выстрелов будут связаны отрицательной корреляцией.
Если в нашем распоряжении имеются результаты ряда опытов над системой двух случайных величин (X, Y), то о наличии или отсутствии существенной корреляции между ними легко судить в первом приближении по графику, на котором изображены в виде точек все полученные из опыта пары значений случайных величин. Например, если наблюденные пары значений величин расположились следующим образом
y
x
то это указывает на наличие явно выраженной положительной корреляции между величинами. На практике, перед тем как исследовать корреляцию случайных величин, всегда полезно предварительно построить наблюденные пары значений на графике для первого качественного суждения о типе корреляции.
Оценки для числовых характеристик системы случайных величин
Имеются результаты n независимых опытов над системой случайных величин (Х,У)
(x1,y1); (x2,y2);….(xn,yn)
Требуется найти оценки для числовых характеристик
mx,my,Dx,Dy и корреляционный момент Kxy
Несмещенными оценками для МОЖ будут
n
mx˜= Σi=1Xi
n
n
mу˜= Σi=1Уi
n
n
D˜x= Σ (xi-mx˜)2
i=1
n
n
Σ (xi-mx˜)2 (yi-my˜)2
Kxy= i=1
n-1
План лекции по т. 11.5
1. Оценки для математического ожидания и дисперсии
2. Доверительный интервал. Доверительная вероятность.
3. Зависимые и независимые случайные величины
Дата добавления: 2016-02-20; просмотров: 1232;