Средняя ошибка аппроксимации
Оценку качества построенной модели дает коэффициент детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации – среднее отклонение расчетных значений зависимой переменной от фактических:
Допустимый предел значений A – не более 8-10 %.
Пример 2.5. Построим регрессионные зависимости: а) расходов на питание (y) и личным доходом (x); б) расходов на питание (y) и временем (t) по следующим данным (усл. ед.):
Год | |||||
X | |||||
Y |
и оценим качество подгонки.
а) Пусть истинная модель описывается выражением y = a + b x + e.
По выборочным наблюдениям определяем оценки (a; b).
Исходные данные и расчетные показатели представим в виде следующей расчетной таблицы:
Год | X | Y | X2 | Xy | ||||
-0,2 | 38,44 | 1,44 | ||||||
2,9 | 9,61 | 0,81 | ||||||
9,1 | 9,61 | 3,61 | ||||||
12,2 | 38,44 | 0,04 | ||||||
Итого | 96,1 | 9,9 | ||||||
Сред. | 84,8 | 21,2 | 19,22 | 1,98 | ||||
Окончательно имеем:
Cледовательно, .
Коэффициент b = 0,775 показывает, что при увеличения дохода на 1 усл. ед расходы на питание увеличиваются в среднем на 0,775 усл. ед.
Замечание.В Excel оценки (a, b) можно также определить с помощью функций:
а = ОТРЕЗОК(массив y; массив x), b = НАКЛОН(массив y; массив x).
Условие выполняется.
Качество подгонки оцениваем коэффициентом детерминации:
, т.е. 90,7 % вариации зависимой переменной (расходы на питание) объясняется регрессией.
Значимость коэффициента R2 проверяем по F-тесту
.
Произведем проверку значимости R2 двумя способами.
1. При α = 0,05, n1= 1 и n2 = 3 по таблице или с помощью функции FРАСПОБР(α; n1; n2) находим Fкр = 10,13. Поскольку F = 29,2 > Fкр = 10,13, то R2 = 0,952 значим при 5 % уровне.
2. Наблюдаемому (расчетному) значению критерия F = 29,2 соответствует значимость F =0,0124, которую можно определить в Excel с помощью функции FРАСП(F; n1; n2).
Поскольку значимостьF = 0,0124 < 0,05, то R2 значим при уровне 5 %.
б) Пусть истинная модель y = a + b t + e, (модель временного ряда). Выборочная регрессия , где t – время, определяемое как t = 1 для 1990 г., t = 2 для 1991 г. и т.д.
Представим исходные и расчетные показатели в виде расчетной таблицы:
Год | t | Y | t2 | ty | |
–0,2 | |||||
2,9 | |||||
9,1 | |||||
12,2 | |||||
Итого | |||||
Среднее | 24,2 | ||||
Окончательно имеем
, следовательно, .
Коэффициент b = 3,1 показывает, что за год расходы на питание в среднем возрастают на 3,1 единиц.
Пример 2.6. Покажем, что в модели регрессии без свободного члена
Y = b X + e оценка МНК дляbесть:
.
Выборочная регрессия для этой модели есть . Наблюдаемые значения зависимой переменной связаны с расчетными уравнением . Оценку b найдем из минимизации величины:
.
Запишем необходимые условия экстремума:
, откуда .
Вычисление R2 при отсутствии свободного члена некорректно; при этом не выполняется условие .
Пример 2.7. Покажем, что в модели регрессии Y = a + e оценка МНК для a есть: .
Выборочная регрессия для заданной модели есть . Наблюдаемые значения зависимой переменной связаны с расчетными значениями уравнением: . Оценку a найдем из минимизации величины
.
Запишем необходимые условия экстремума:
откуда
Выборочная регрессия .
Дата добавления: 2016-02-16; просмотров: 4085;