Средняя ошибка аппроксимации
Оценку качества построенной модели дает коэффициент детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации – среднее отклонение расчетных значений зависимой переменной от фактических:

Допустимый предел значений A – не более 8-10 %.
Пример 2.5. Построим регрессионные зависимости: а) расходов на питание (y) и личным доходом (x); б) расходов на питание (y) и временем (t) по следующим данным (усл. ед.):
| Год | |||||
| X | |||||
| Y |
и оценим качество подгонки.
а) Пусть истинная модель описывается выражением y = a + b x + e.
По выборочным наблюдениям определяем оценки (a; b).
Исходные данные и расчетные показатели представим в виде следующей расчетной таблицы:
| Год | X | Y | X2 | Xy |
|
|
|
|
| -0,2 | 38,44 | 1,44 | ||||||
| 2,9 | 9,61 | 0,81 | ||||||
| 9,1 | 9,61 | 3,61 | ||||||
| 12,2 | 38,44 | 0,04 | ||||||
| Итого | 96,1 | 9,9 | ||||||
| Сред. | 84,8 | 21,2 | 19,22 | 1,98 | ||||
|
|
|
|
|
|
|
|
Окончательно имеем:

Cледовательно,
.
Коэффициент b = 0,775 показывает, что при увеличения дохода на 1 усл. ед расходы на питание увеличиваются в среднем на 0,775 усл. ед.
Замечание.В Excel оценки (a, b) можно также определить с помощью функций:
а = ОТРЕЗОК(массив y; массив x), b = НАКЛОН(массив y; массив x).
Условие
выполняется.
Качество подгонки оцениваем коэффициентом детерминации:
, т.е. 90,7 % вариации зависимой переменной (расходы на питание) объясняется регрессией.
Значимость коэффициента R2 проверяем по F-тесту
.
Произведем проверку значимости R2 двумя способами.
1. При α = 0,05, n1= 1 и n2 = 3 по таблице или с помощью функции FРАСПОБР(α; n1; n2) находим Fкр = 10,13. Поскольку F = 29,2 > Fкр = 10,13, то R2 = 0,952 значим при 5 % уровне.
2. Наблюдаемому (расчетному) значению критерия F = 29,2 соответствует значимость F =0,0124, которую можно определить в Excel с помощью функции FРАСП(F; n1; n2).
Поскольку значимостьF = 0,0124 < 0,05, то R2 значим при уровне 5 %.
б) Пусть истинная модель y = a + b t + e, (модель временного ряда). Выборочная регрессия
, где t – время, определяемое как t = 1 для 1990 г., t = 2 для 1991 г. и т.д.
Представим исходные и расчетные показатели в виде расчетной таблицы:
| Год | t | Y | t2 | ty |
|
| –0,2 | |||||
| 2,9 | |||||
| 9,1 | |||||
| 12,2 | |||||
| Итого | |||||
| Среднее | 24,2 | ||||
|
|
|
|
|
Окончательно имеем
, следовательно,
.
Коэффициент b = 3,1 показывает, что за год расходы на питание в среднем возрастают на 3,1 единиц.
Пример 2.6. Покажем, что в модели регрессии без свободного члена
Y = b X + e оценка МНК дляbесть:
.
Выборочная регрессия для этой модели есть
. Наблюдаемые значения зависимой переменной связаны с расчетными уравнением
. Оценку b найдем из минимизации величины:
.
Запишем необходимые условия экстремума:
, откуда
.
Вычисление R2 при отсутствии свободного члена некорректно; при этом не выполняется условие
.
Пример 2.7. Покажем, что в модели регрессии Y = a + e оценка МНК для a есть:
.
Выборочная регрессия для заданной модели есть
. Наблюдаемые значения зависимой переменной связаны с расчетными значениями уравнением:
. Оценку a найдем из минимизации величины
.
Запишем необходимые условия экстремума:
откуда 
Выборочная регрессия
.
Дата добавления: 2016-02-16; просмотров: 4205;
