С автокорреляцией остатков

Вернемся еще раз к предположению (3.3). Из него, в частности, следует, что ковариации случайной ошибки для разных наблюдений равны нулю. Если к тому же случайные ошибки распределены нормально, то это означает их попарную независимость.

Однако регрессионные модели в экономике часто содержат стохастические зависимости между значениями случайных ошибок – автокорреляцию ошибок. Ее причинами являются: во-первых, влияние некоторых случайных факторов или опущенных в уравнении регрессии важных объясняющих переменных, которое не является однократным, а действует в разные периоды времени; во-вторых, случайный член может содержать составляющую, учитывающую ошибку измерения объясняющей переменной.

Применение к модели с автокорреляцией остатков обыкновенного МНК приведет к следующим последствиям:

1. Выборочные дисперсии полученных оценок коэффициентов будут больше по сравнению с дисперсиями по альтернативным методам оценивания, т.е. оценки коэффициентов будут неэффективны.

2. Стандартные ошибки коэффициентов будут оценены неправильно, чаще всего занижены, иногда настолько, что нет возможности воспользоваться для проверки гипотез соответствующими точными критериями – мы будем чаще отвергать гипотезу о незначимости регрессии, чем это следовало бы делать в действительности.

3. Прогнозы по модели получаются неэффективными.

На практике исследователь в этом случае поставлен перед проблемой тестирования наличия в модели автокорреляции, а также выявления причины автокорреляции при ее обнаружении: или в модели опущена существенная переменная, или структура ошибок зависит от времени. То есть, исследование остатков позволяет судить о правильности модели и ее пригодности для прогнозирования.

Простейшим способом проверки наличия автокорреляции является графическое изображение остатков e_i. Возможно построение:

· графика временной последовательности, если остатки получены в разные моменты времени;

· графика зависимости остатков от значений , полученных по регрессии;

· графиков зависимости остатков от объясняющих переменных.

Если изображение остатков представляет собой горизонтальную полосу, это указывает на отсутствие каких-либо проблем, связанных с моделью. В противном случае в зависимости от вида и типа графика можно получить информацию о: неадекватности модели, ошибочности расчетов, необходимости включения в модель линейного или квадратичного члена от времени; наконец о непостоянстве дисперсии.

Ясно, что ошибки могут коррелировать по-разному, однако без нарушения общности можно рассматривать так называемую сериальную корреляцию (автокорреляцию), когда зависимость между ошибками, отстоящими на некоторое количество шагов s, называемое порядком корреляции (в частности, на один шаг, s=1), остается одинаковой, что хорошо проявляется визуально на графике в системе координат (e_i; e_i_-_s). Например, для s=1 на рис. 4.2 показаны отрицательная (слева) и положительная (справа) автокорреляция остатков. В экономических исследованиях чаще всего встречается положительная автокорреляция.

Рис. 4.2. Автокорреляция остатков

Более достоверным способом проверки существования автокорреляции является применение статистических критериев. Хорошо известны два – критерий знаков (относится к непараметрическим критериям) и критерий Дарбина-Уотсона.

Для проведения проверки по критерию знаков необходимо расположить остатки e_i во временной последовательности, выписать их знаки, подсчитать число образующихся при этом серий n_u из одинаковых знаков, а также n₁ – число остатков со знаком плюс и n₂ – число остатков со знаком минус. Далее определяется вероятность Pr(n_u) появления n_u групп при нулевой гипотезе – последовательность остатков полностью случайна (автокорреляция отсутствует). Если Pr(n_u) < 1–a, где a – уровень доверия, то нулевая гипотеза отвергается.

Для ускорения расчетов для выборок с n₁, n₂ не больше 20 составлены таблицы с критическими значениями n_u при уровне доверия a=0,05.

Для больших выборок истинное распределение ошибок достаточно точно аппроксимируется нормальным со средним m=2n₁n₂/(n₁+n₂)+1 и дисперсией s²=2n₁n₂(2n₁n₂– n₁– n₂)/(n₁+ n₂)²/(n₁+ n₂– 1), а величина z=(u – m + 0,5)/s подчиняется нормированному нормальному распределению, следовательно, критические значения n_u могут быть вычислены по формулам (m + z_as) и (m – z_as), где z_a определяется из условия F₀(z_a)=(1–a)/2 (значения даны в справочниках).

Пример. Получены остатки 0,6; 1,9; –1,8; –2,7; –2,9; 1,4; 3,3; 0,3; 0,8; 2,3; –1,4; –1,1, которые обнаруживают следующую последовательность знаков + + – – – + + + + + – –. Имеем n_u=4, n₁=7, n₂=5. По таблице находим критические значения для n_u: 3 и 11. Так как 3 < n_u < 11, то нулевая гипотеза принимается, то есть остатки независимы и автокорреляция отсутствует.Ñ

Критерий знаков достаточно прост и не использует информацию о величине e_i, и поэтому недостаточно эффективен.

Для проверки гипотезы о существовании линейной автокорреляции первого порядка, которая чаще всего имеет место на практике, предпочтителен критерий Дарбина-Уотсона, основанный на статистике:

(4.9)

Значения первых разностей ошибки в (4.9) будут обнаруживать тенденцию к уменьшению по абсолютной величине по сравнению с абсолютными значениями e_i при положительной автокорреляции и к увеличению при отрицательной автокорреляции.

Для статистики d имеются верхний d_U и нижний d_L пределы уровня значимости. Различные статистические решения для нулевой гипотезы H₀: автокорреляция равна нулю, даны в табл. 4.3. При этом появляются области неопределенности, так как величина e_i зависит не только от значений u, но и от значений последовательных X.

Следует отметить, что критерий Дарбина-Уотсона предназначен для моделей с детерминированными (нестохастическими) регрессорами X и не применим, например, в случаях, когда среди объясняющих переменных есть лаговые значения переменной Y.

Таблица 4.3

Области статистических решений для критерия Дарбина-Уотсона

d<d_L	d_L<d<d_U	d_U<d<2; 2<d<(4–d_U)	(4–d_U)<d<(4–d_L)	d>(4–d_L)
Отвергаем H₀ в пользу гипотезы о положительной автокорреляции	H₀ не принимается и не отвергается	Принимается H₀	H₀ не принимается и не отвергается	Отвергаем H₀ в пользу гипотезы об отрицательной автокорреляции

Пример. Для примера 1 из п. 3.2 n=20, k=2 имеем табл. 4.4.

Далее по формуле (4.9) d=4397,66/2050,37=2,14.

Значения d_L и d_U при уровне значимости 5% получим из справочника при n=20 и k=2: d_L=1,10, d_U=1,54.

Так как d>2, то вычисляем 4–d_U=2,46 и 4–d_L=2,90 и 2<d<4–d_U.

Согласно табл. 4.3 гипотеза о равенстве нулю автокорреляции принимается. Ñ

Какой бы тест на автокорреляцию не использовался, необходимо помнить, что рекомендуется в случаях неопределенности (см. табл. 4.3) принимать гипотезу о наличии автокорреляции, поскольку это гарантирует от отрицательных последствий автокорреляции. В случаях же некорректного принятия гипотезы о равенстве нулю автокорреляции получаем модель, которая не может иметь удовлетворительного применения, хотя формально проходит все проверки.

Таблица 4.4

Вычисление значения статистики d

Ошибка e_i	e_i²	e_i-1	(e_i-e_i-1)²	Ошибка e_i	e_i²	e_i_-1	(e_i-e_i_-1)²

-2,49	6,20			-0,68	0,46	-8,72	64,64
-1,86	3,46	-2,49	0,40	5,27	27,72	-0,68	35,40
31,93	1019,21	-1,86	1141,76	-5,29	27,93	5,27	111,51
-3,18	10,11	31,93	1232,71	-16,74	280,23	-5,29	131,10
-2,17	4,71	-3,18	1,02	8,94	79,87	-16,74	659,46
-18,38	337,64	-2,17	262,76	-3,57	12,74	8,94	156,50
-3,45	11,90	-18,38	222,90	5,18	26,79	-3,57	76,56
5,58	31,14	-3,45	81,54	7,72	59,60	5,18	6,45
-3,11	9,67	5,58	75,52	-0,85	0,72	7,72	73,44
-8,72	76,04	-3,11	31,47	4,85	23,47	-0,85	32,49
Сумма					2050,37		4397,66

Рассмотрим методы оценивания уравнения регрессии при наличии автокорреляции остатков.

Пусть имеем обобщенную линейную модель множественной регрессии в виде (4.3)-(4.7) с гомоскедастичными остатками .

Предположим, что остатки u_i удовлетворяют следующему уравнению:

u_i=ru_i_-1+e_i, i=2,...,n, (4.10)

представляющему собой авторегрессионную модель первого порядка, для которой выполнено |r|£1, а e_i удовлетворяют условиям:

E(e_i)=0; (4.11)

Тогда несложно показать, что будет выполняться:

. (4.12)

Условие (4.12) является аналогом (4.5) и фактически означает гомоскедастичность дисперсии случайного члена (первая строчка) и автокорреляцию первого порядка (вторая строчка). Ясно, что если бы было известно значение r в (4.10) и затем в (4.12), то можно было бы применить ОМНК (элементы матрицы W в этом случае вычисляются согласно (4.12)) и получить эффективные оценки коэффициентов регрессии. Однако на практике значение r в большинстве случаев не известно, поэтому используются следующие методы оценивания регрессионной модели.

Метод 1. Отказавшись от определения величины r, являющейся узким местом модели, статистически, можно положить r=0,5; 1 или -1. Однако даже грубая статистическая оценка будет, видимо, более эффективной, поэтому другой способ определения r с помощью статистики Дарбина-Уотсона r»1–0,5d. Применяя затем непосредственно ОМНК, получим оценки коэффициентов.

Метод 2. Если значение r в (4.12) задано, то альтернативная схема отыскания оценок коэффициентов модели множественной регрессии суть (в целях упрощения, не нарушая общности, иллюстрация метода дана для случая парной регрессии):

а) Запишем уравнение модели для случая i и i–1:

Вычтем из обеих частей первого уравнения умноженное на r второе уравнение:

или переобозначив:

с учетом (4.10) , получим модель

, (4.13)

для случайного члена которой выполняется условие (4.11), т.е. автокорреляция отсутствует. При указанном преобразовании первое наблюдение умножается на , т.е. , .

б) Применяем обыкновенный МНК к модели (4.13).

В общем случае мы не располагаем информацией о порядке автокорреляции и значениях параметров в авторегрессионном уравнении, а значит, и методы 1 и 2 не дадут искомого результата.

Тем не менее, оценки коэффициентов можно найти приближенно с помощью следующих методов (опять в целях упрощения, не нарушая общности, иллюстрация методов дана для случая парной регрессии).

Метод 3. Итеративная процедура Кохрейна-Оркатта.

а) Оценивается регрессия с исходными не преобразованными данными с помощью обыкновенного МНК.

б) Вычисляются остатки e_i.

в) Оценивается регрессия e_i=re_i_-1+e_i, и коэффициент при e_i_-1 дает оценку r.

г) С учетом полученной оценки r уравнение преобразовывается к виду (4.13), оценивание которого позволяет получить пересмотренные оценки коэффициентов b₀ и b₁.

д) Вычисляются остатки регрессии (4.13) и процесс выполняется снова, начиная с этапа в).

Итерации заканчиваются, когда абсолютные разности последовательных значений оценок коэффициентов b₀, b₁и r будут меньше заданного числа (точности).

Подобная процедура оценивания порождает проблемы, касающиеся сходимости итерационного процесса и характера найденного минимума: локальный или глобальный.

Метод 4. Метод Хилдрета-Лу основан на тех же принципах, что и рассмотренный метод 3, но использует другой алгоритм вычислений. Здесь регрессия (4.13) оценивается МНК для каждого значения r из диапазона [-1, 1] с некоторым шагом внутри него. Значение, которое дает минимальную стандартную ошибку для преобразованного уравнения (4.13), принимается в качестве оценки r, а коэффициенты регрессии определяются при оценивании уравнения (4.13) с использованием этого значения.

Метод 5. Дарбиным была предложена простая схема, дающая эффективные оценки коэффициентов:

а). Подставляя (4.10) в модель Y_i=b₀+b₁X_i+u_i, получим с учетом u_i_-₁= Y_i_-1- b₀- b₁X_i_-1:

Y_i=b₀(1-r)+rY_i_-1+b₁(X_i - rX_i_-1) + e_i,

где ошибка e_i удовлетворяет (4.11). Применяя обыкновенный МНК к последней модели, получаем оценку r как коэффициента при Y_i_-1.

б). Вычисляем значения преобразованных переменных и применяем к ним обыкновенный МНК. Получаем искомые оценки коэффициентов регрессии.

Достоинством метода является простота его распространения на случай автокорреляции более высокого порядка.

Как показывают эксперименты, проведенные для малых выборок, лучшим является двухшаговый метод 2, использующий оценку r, полученную по методу, предложенному Дарбиным (метод 5 шаг а)).

<15 16 171819 20 21 >

Дата добавления: 2017-04-20; просмотров: 797;