Парная линейная регрессия.
Связь между показателем Y и фактором Х с учетам возможных отклонений запишем в виде , где
– неизвестные параметры регрессии,
– случайная величина, которая характеризует отклонение параллельно оси
наблюдаемых точек от линии регрессии.
Таким образом, показатель Y представляется в виде систематической составляющей и случайной составляющей величины
. Зависимость
, которая характеризует среднее значение показателя Y для данного значения фактора Х, называется регрессией. Можно сказать иначе. Регрессия характеризует тенденцию изменения показателя, обусловленную изменением фактора. Зависимость
характеризует индивидуальное значение показателя Y с учетом возможных отклонение от средних значений.
Действительные значения параметров вычислить нельзя, так как мы имеем ограниченное число наблюдений, поэтому полученные расчетные значения параметров и
являются статистическими оценками действительных параметров
и
. Обозначим оценки параметров соответственно через а и b. Тогда уравнение парной регрессии
(рис.1) будет оценкой модели
.
y
0 xi x
Рис. 1.1. Отклонение теоретических значений от фактических.
Рассмотрим разность и
, (i=1, n):
,
где – фактические,
– расчетные значения показателя,
– отклонение наблюдаемой точки (
) от точки (
) сглаживающей кривой. Метод наименьших квадратов заключается в таком подборе оценок параметров регрессии а и b, для которых сумма квадратов отклонений наблюдаемых значений показателя от сглаживаемых будет минимальной, т.е. необходимо минимизировать
:
Необходимым условием экстремума функции двух переменных является равенство нулю частных производных этой функции по переменным а и b:
Отсюда имеем:
(1.1)
Система является линейной относительно переменных а и b. Решая ее, получим:
(1.2)
Функция имеет единственную критическую точку.
Вычислим вторые производные в найденной критической точке и обозначим их А, В, С:
.
Если и
, то в точке (
) функция
имеет минимум. Проверим это достаточное условие:
Вычислим :
Здесь соответственно математическое ожидание и дисперсия случайной величины Х. Если случайная величина Х не является постоянной, то
, поэтому
. Поскольку
, то решение (1.2) системы (1.1) является точкой минимума функции
.
Дата добавления: 2016-05-11; просмотров: 581;