Корреляция и регрессия.

Зависимость, при которой изменение одной случайной величины вызывает изменение распределения другой, называется статистической. При статистической зависимости различают корреляцию[2]для установления взаимосвязи между двумя или более случайными величинами с оценкой тесноты этой связи, и регрессию, при которой устанавливается форма (характер) зависимости между случайными величинами, чаще всего в виде полиномов.

Оценка тесноты связи производится путем расчета коэффициента ковариации , равного для двух случайных величин х и y:

(2.1)

где и - средние значения величин х и y.

Поскольку размерности х и y могут быть разные, то вычисляют коэффициент корреляции обычно в виде

(2.2)

где и - среднеквадратические отклонения Х и Y.

Коэффициент корреляции (2.2) изменяется от -1 до +1. При корреляция положительна, при корреляция отсутствует, при говорят о наличии обратной корреляции между двумя случайными величинами.

В общем случае, когда число значений и различно, коэффициент корреляции вычисляется по формуле:

где - число значений, принимающих одновременно величины и , n – общее число и .

В том случае, когда число случайных величин больше двух (N>2), корреляция оценивается либо по ковариационной матрице B, равной:

(2.3)

где - коэффициенты ковариации, причем , а по диагонали матрицы (2.3) расположены дисперсии случайных величин , либо по корреляционной матрице R, равной

(2.4)

где - коэффициенты корреляции, . Обе матрицы (2.3) и (2.4) симметричны относительно главной диагонали.

Под регрессией понимают сглаживание экспериментальной зависимости по методу наименьших квадратов. Метод наименьших квадратов состоит в минимизации суммы квадратов отклонений сглаживающей прямой (кривой) от экспериментальной зависимости , т.е.

где может быть линейная , нелинейная или множественная регрессия.

Метод наименьших квадратов приводит к системе нормальных уравнений для нахождения коэффициентов регрессии

Эта система уравнений в матричной форме выражается следующим образом

 

(2.5)

 

где X - матрица значений исходных случайных величин ; - транспонированная к X матрица; А – матрица-столбец коэффициентов регрессии ; Y – матрица-столбец случайной величины Y, для которой устанавливается форма (вид) регрессии, обычно в виде полинома.

На базе регрессионного анализа решаются две основные задачи: а) установление формы корреляционной связи, т.е. вида регрессии; б) оценка тесноты корреляционной связи. Ниже рассматриваются различные виды регрессий путем решения системы уравнений (2.5).

 








Дата добавления: 2016-01-16; просмотров: 898;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.004 сек.