Корреляция и регрессия.
Зависимость, при которой изменение одной случайной величины вызывает изменение распределения другой, называется статистической. При статистической зависимости различают корреляцию[2]для установления взаимосвязи между двумя или более случайными величинами с оценкой тесноты этой связи, и регрессию, при которой устанавливается форма (характер) зависимости между случайными величинами, чаще всего в виде полиномов.
Оценка тесноты связи производится путем расчета коэффициента ковариации , равного для двух случайных величин х и y:
(2.1)
где и
- средние значения величин х и y.
Поскольку размерности х и y могут быть разные, то вычисляют коэффициент корреляции обычно в виде
(2.2)
где и
- среднеквадратические отклонения Х и Y.
Коэффициент корреляции (2.2) изменяется от -1 до +1. При корреляция положительна, при
корреляция отсутствует, при
говорят о наличии обратной корреляции между двумя случайными величинами.
В общем случае, когда число значений и
различно, коэффициент корреляции вычисляется по формуле:
где - число значений, принимающих одновременно величины
и
, n – общее число
и
.
В том случае, когда число случайных величин больше двух (N>2), корреляция оценивается либо по ковариационной матрице B, равной:
(2.3)
где - коэффициенты ковариации, причем
, а по диагонали матрицы (2.3) расположены дисперсии случайных величин
, либо по корреляционной матрице R, равной
(2.4)
где - коэффициенты корреляции,
. Обе матрицы (2.3) и (2.4) симметричны относительно главной диагонали.
Под регрессией понимают сглаживание экспериментальной зависимости по методу наименьших квадратов. Метод наименьших квадратов состоит в минимизации суммы квадратов отклонений сглаживающей прямой (кривой) от экспериментальной зависимости
, т.е.
где может быть линейная
, нелинейная
или множественная
регрессия.
Метод наименьших квадратов приводит к системе нормальных уравнений для нахождения коэффициентов регрессии
Эта система уравнений в матричной форме выражается следующим образом
(2.5)
где X - матрица значений исходных случайных величин ;
- транспонированная к X матрица; А – матрица-столбец коэффициентов регрессии
; Y – матрица-столбец случайной величины Y, для которой устанавливается форма (вид) регрессии, обычно в виде полинома.
На базе регрессионного анализа решаются две основные задачи: а) установление формы корреляционной связи, т.е. вида регрессии; б) оценка тесноты корреляционной связи. Ниже рассматриваются различные виды регрессий путем решения системы уравнений (2.5).
Дата добавления: 2016-01-16; просмотров: 927;