Линии регрессии. Метод наименьших квадратов (МНК).
Линии регрессии - это линии, отражающие основную форму зависимости отклика Y от факторного признака X. Определение вида этих линий – основная задача регрессионного анализа.

МНК позволяет определить параметры линии регрессии 
Ломаная линия, соединяющая фактические данные на корреляционном поле, называется эмпирической регрессией.
Основное требование МНК: Сумма квадратов отклонений эмпирических значений отклика от теоретических должна быть минимальной.
или 
Отклонение 

Рассмотрим простейший случай – линейную регрессию.

Определим с помощью МНК неизвестные параметры a и b:

Решаем эту систему нормальных уравнений методом Крамера:



(*)
Регрессия y на x задается следующей формулой : 

Это две различные прямые, пересекающиеся в точке
:

Одна из этих прямых y=ax+b получается в результате решения задачи минимизации суммы квадратов отклонений по вертикали, а другая (x=cy+d) - по горизонтали.
Для удобства определения параметров a и b можно использовать следующую таблицу:
| i |
|
|
|
|
| … n |
…
|
…
|
…
|
…
|
|
|
|
|
|


Уравнение регрессии нужно в первую очередь для проведения прогноза (экстраполяции и интерполяции). При экстраполяции не рекомендуется выходить как в сторону больших, так и в сторону меньших значений по X за пределы, превышающие 1/3 размаха вариации по X.
Границы доверительного интервала определяются следующим образом:

- значение точечного прогноза,
-значение факторного признака, для которого выполняется прогноз,
m - число параметров в уравнении регрессии.
n-m - число степеней свободы,
a - уровень значимости,
(в нашем случае a будет иметь смысл вероятности ошибки прогноза).
- остаточное среднеквадратическое отклонение, скорректированное по числу степеней свободы.
Дата добавления: 2015-12-11; просмотров: 951;

…
…
…
…