Метод наименьших квадратов. Пусть проводится n однородных испытаний или экспериментов, и результатом каждого испытания является пара чисел – значений некоторых переменных x и y
Пусть проводится n однородных испытаний или экспериментов, и результатом каждого испытания является пара чисел – значений некоторых переменных x и y. Испытание с номером i приводит к числам xi, yi. В качестве испытания можно, например, рассматривать выбор определенного предприятия в данной отрасли промышленности, величиной x считать объем производства продукции (например в миллионах рублей), величиной y – объем экспорта этого вида продукции (в миллионах рублей), и обследовать n предприятий отрасли.
Итогом этих испытаний является таблица:
. . . | ||||
. . . |
где каждому числу xi (величину рассматриваем как независимый показатель или фактор) поставлено в соответствие число (величину рассматриваем как зависимый показатель – результат).
В качестве значений часто рассматриваются моменты времени: t1, t2, ..., tn, взятые через равные промежутки. Тогда таблица
. . . | ||||
. . . |
называется временным рядом.
Нас интересует вопрос, как найти приближенную формулу для функции y = f(x), которая “наилучшим образом” описывала бы данные таблицы.
Пусть точки с координатами (xi,yi) группируются на плоскости вдоль некоторой прямой. Задача заключается в том, чтобы найти параметры a0 и a1 этой прямой:
y = a0 + a1x, (1)
причем это нужно сделать так, чтобы она лучше любой другой прямой соответствовала расположению на плоскости экспериментальных точек (xi, yi).
Признаком наилучшей прямой считается минимум суммы квадратов отклонений фактических значений y, полученных из таблицы, от вычисленных по формуле (1). Эта сумма квадратов рассчитывается по формуле
S2 = (y1 – (a0 + a1x1))2 + (y2 – (a0 + a1x2))2 +...+ (yn – (a0 + a1xn))2 =
.
Обратим внимание на то, что все xi и yi — известные из таблицы числа, а S2 есть функция двух переменных a0 и a1.
S2 = S2(a0,a1)
Можно показать, что график функции S2 выглядит примерно так, как изображено на рисунке. Единственная точка, в которой обе частные производные и равны нулю, является точкой минимума.
Отсюда следует, что точку минимума можно искать, используя лишь необходимые условия экстремума:
(2)
. (3)
На самом деле для функции S2 = S2(a0,a1) достаточно легко проверить выполнение достаточных условия экстремума. тогда Уравнения (2) и (3) можно преобразовать:
. (4)
Получилась так называемая система нормальных уравнений относительно неизвестных величин a0 и a1.
Формула (1) с параметрами a0, a1 определенными из системы (4), называется уравнением регрессии. Прямая линия, описываемая этим уравнением, называется линией регрессии. Для временных рядов обычно вместо слова “регрессия” употребляется слово тренд.
Если экспериментальные точки в плоскости XOY группируются вдоль некоторой кривой линии, то можно подобрать вместо формулы (1) другую подходящую формулу, например, y = a0 + a1x + a2x2 или y = a0 exp(a1x) с параметрами соответственно a0, a1, a2 и a0, a1, подставить ее в выражение и искать минимум получившейся функции S2 при помощи частных производных по параметрам.
Дата добавления: 2015-08-11; просмотров: 849;