Авторегресійні моделі прогнозування

Методика прогнозування цінна в тому випадку, якщо вона спирається на обґрунтовану теорію, що встановлює правомочність прогнозування за допомогою даної моделі і помилки вірогідності прогнозу. Оцінка такої помилки за допомогою функції зростання неможлива, тому особливий інтерес представляють авторегресійні моделі.

Авторегресією називається рівняння, що визначає змінну Хj у момент t (або t-й період) через її значення в попередні періоди: (t-1) (t-2)... (t-к). Лінійне авторегресійне рівняння записуємо у вигляді

Х_t= а₁ Х_t-1 + а₂ Х_t-2 + + а_к Х_t-к. (4.18)

Першим етапом дослідження тимчасового ряду змінної Х є виділення загальної тенденції у вигляді функції d(t) і визначення залишків ε_t у формі ε_t = Х_t - d(t) чи ε_t₌d(х_t).

Якщо залишки ε_t незалежні, тобто не можуть бути представлені як функція часу, то функція d(t) охоплює повністю еволюційну складову змінної Х_t. При цьому залишається знайти закон їх розподілу ε_t і, прийнявши гіпотезу про збереження цього закону розподілу на прогнозований період, побудувати довірчий інтервал для прогнозованої величини Х_t за функцією d(t). Якщо ж залишки ε_t залежні, тобто містять деяку тенденцію, то її можна виявити за допомогою коефіцієнта автокореляції. Проводячи зсув значень ε_t на один рядок і останнє значення переміщаємо на перше місце, одержуємо табл. 4.6.

Таблиця 4.6 – Залишки змінних ряду динаміки

ε_t	ε_t-1
ε₁	ε_n
ε₂	ε₁
ε₃	ε₂
…………	…………..
ε_n	ε_n-1

Обчислюємо циклічний коефіцієнт кореляції між рядами ε_t і ε_t_-1 за формулою

r(ε_t, ε_t_-1) = . (4.19)

Ця формула (4.19) виходить із звичайної формули для визначення коефіцієнта кореляції, якщо покласти

∑ ε_t₌∑ ε_t_-1= 0; (4.20)

∑ (ε_t _-1)²=∑ (ε_t)². (4.21)

Формула (4.20) виходить з того, що параметри функції d(t) визначаються за методом якнайменших квадратів, а формула (4.21) - з циклічної табл. 4.6.

Аналогічно, зсовуючи ε_{t на 2,3….К}рядків, одержуємо циклічну таблицю послідовних відхилень

Таблиця 4.7 - Циклічна таблиця послідовних відхилень

t	ε_t	ε_t-1	ε_t-2	………	ε_t-к+1	ε_t-к
	ε₁	ε_n	ε_n-1		ε_n-k+2	ε_n-k+1
	ε₂	ε₁	ε_n		ε_n-k+3	ε_n-k+2
	ε₃	ε₂	ε₁		ε_n-k+4	ε_n-k+3
….	….	….	….	….		….
К	ε_k	ε_k-1	ε_k-2		ε₁	ε_n
К+1	ε_k+1	ε_k	ε_k-1		ε₂	ε₁
К+2	ε_k+2	ε_k+1	ε_k		ε₃	ε₂
…..	…..	….	….	….	….	….
n	ε_n	ε_n-1	ε_n-2		ε_n-k+1	ε_n-k

За даними табл. 4.7 визначаємо всі циклічні коефіцієнти автокореляції:

r(ε_xt ε_xt-j) = , i, j = 1,2,…..K; (4.22)

r(ε_xt_-1 ε_xt_-_j) = . (4.23)

Циклічний коефіцієнт автокореляції не підпорядковується нормальному закону розподілу, його розподіл асиметричний, суттєві величини коефіцієнтів автокореляції при певному рівні значущості різні для позитивних і негативних його значень. 5% - й і 1% - й рівні значущості коефіцієнтів автокореляції подані в спеціальних таблицях. Знайдені значення r₁, r₂… r_n_-к-1перевіряємо по таблиці 5% - х і 1% - х рівнів вірогідності коефіцієнтів автокореляції. Якщо | r_{стат. (}_n₎ | < | r_{5%. (}_n₎ |, то приймаємо гіпотезу неавтокорельованості залишків ε_t; якщо | r_{стат. (}_n₎ | > | r_{1%. (}_n₎ | відкидаємо гіпотезу їх неавтокорельованості.

За циклічними коефіцієнтами автокореляції складаємо матрицю і її обертаємо. Як і в разі звичайної регресії багаточинника, перевіряємо наявність мультиколінеарності кожного з чинників ε_xt_-_j, j=1,2-k від сукупності інших і зберігаємо тільки лінійно незалежні аргументи.

Будуємо лінійну авторегресійну модель

ε_t = а₁ ε_t-1 + а₁ ε_t-2 + ….+ а_к ε_t-к, (4.24)

що виражає ε_t в період t за допомогою значень ε_t-j, j = 1,2…К за К попередніх періодів. При цьому в рівнянні повинні бути збережені тільки суттєві і лінійно незалежні коефіцієнти.

Якщо виявляються а_j – коефіцієнти, що не задовольняють вказаним вимогам, то модель потребує перерахунку (починаючи з розрахунку автокореляційної матриці більш низького порядку).

Оскільки параметри рівняння тренда визначали за методом найменших квадратів, то в разі його коректного підбору відповідні відхилення підкоряються нормальному розподілу, і, отже, рівняння регресії можна відшукувати в лінійній формі

ℓ_nX_t = a₁ ℓ_n X_t-1 + a₂ ℓ_n X_t-2+…….+a_k ℓ_n X_t-k+ F(t); (4.25)

X_t= a₁ X_t-1 + a₂ ℓ_n X_t-2 +……..+ a_nX_t-k+ F(t). (4.26)

Яким повинне бути число членів рівняння, це питання слід вирішувати в поєднанні професійних вимог процесу, що по суті вивчається, з математико-статистичними критеріями. Так, якщо статистичний ряд містить тижневі дані, то особливий інтерес являє чотиричленна модель залежності рівня показника від тижневих рівнів за весь попередній місяць. У разі місячних даних цікава тричленна авторегресія, а для даних, зібраних по роках, – п’ятичленна.

Статистичні критерії покликані встановити відсутність автокорельованості залишків від віднімання з табличних значень ε_t їх розрахункових значень

η_t = ε_t– (a₁ ε_t-1+ a₂ ε_t-2 +…+ a_k ε_t-2k). (4.27)

Існує декілька статистичних критеріїв. Один з них заснований на порівнянні середнього квадрата послідовних різниць η_t:

. (4.28)

З дисперсією величини

(4.29)

Складаємо відношення середнього квадрата послідовних різниць, до середнього квадрата самих величин:

К = . (4.30)

Якщо К_стат., потрапляє в допустиму область при рівні значущості 5%, а саме К_5%(n-k) < К_стат(n-k) < К¹_5%(n-k), то приймаємо гіпотезу неавтокорельованості залишків η_t, а, отже, і достатності числа членів К авторегресійної моделі.

Якщо ж К_стат (n-k) < К_%(n-k) або К_стат> К_1% (n-k), то відкидаємо гіпотезу неавтокорельованості залишків η_t і рахуємо число членів рівняння недостатності. У цьому випадку число членів рівняння треба збільшити, якщо довжина ряду дозволяє це.

Користуючись для прогнозу розробленими рівняннями, можна знайти довірчий інтервал для значення прогнозованого показника.

Якщо прогнозований показник рівний , то розмір показника Х_t записуємо у вигляді

- ≤ Xt ≤ + . (4.31)

Викладена методика складання авторегресійних моделей, використані критерії і побудований довірчий інтервал можна застосовувати тільки для великих вибірок, коли довжина ряду n не менше 30.

Помилка прогнозу по отриманих рівняннях визначається за дисперсії ε_t. Оскільки

- Х_t = ε_t, (4.32)

то Β_ер = | ε_t| ≤ t_α σ_ε= P_α, (4.33)

де P_α – задана вірогідність, P_α = 1-α, а t_α - відповідна межа по С (n-k) ступеням свободи Стьюдента:

σ_ε = . (4.34)

Розглянемо приклади складання авторегресійних моделей.

Одночленна модель. Щомісячний пробіг рухомого складу міського електротранспорту на 1000 пасажирів, що перевозяться, заданий рядом в графі 2 табл. 4.8. Наявність експоненціального ряду (див. рис. 4.3.) дозволяє розраховувати на придатність одночленної моделі = а₁Х_t-1.

Система нормальних рівнянь для визначення параметра а₁ має вигляд

= а₁_. (4.35)

З табл. 4.3. (графи 4 і 5) виходить 367673,4 = 364278,2 а₁

Звідки а_{1 =}= 1,0087 ≈ 1,01.

Одержуємо рівняння = 1,01 Х_t-1. Обчислюємо значення = 1,01 Х_t_-1 (графа 6) і знаходимо значення ε_t₌X_t -Х_t_-1 (графа 7) ∑ ε_t = 9,4, що несуттєво в порівнянні з розмірами X_t.

Обчислюємо коефіцієнт циклічної автокореляції r₁. За графами 9 і 10 отримаємо

r₁ = r(ε_t, ε_t_-1) = (4.36)

З табл. 4.3 знаходимо n¹ = 15-1=14, r<0, r_5% = -0,479.

Оскільки | r₁| < | r_5%|, кореляція ε_t, ε_t_-1несуттєва.

Аналогічно за графами 12 і 10 (табл. 4.8.) одержуємо r₂ = = 0,416, що свідчить про несуттєвість кореляції ε_t и ε_t-2.

У даному випадку переважний критерій Дж. Неймана. Обчислюємо різницю ε_t-ε_t-1за графами 13 і (ε_t-ε_t-1)² – за графами 14. Одержуємо

K= (4.37)

За табл. 4.3 для n₁ = 14 рівень значущості К_5% рівний 1,2725 при r > 0 і 3,0352 у разі r < 0. Розрахунки свідчать, що коли в генеральній сукупності автокореляція між залишками ε_t відсутня, то в 95% вибірок буде К > 1,272 у випадку r > 0 и К < 3,0352 при <.

У даному прикладі значення К потрапляє в допустиму область при 5% рівні значущості К > 1,2725. Отже, гіпотеза неавтокорельованості залишків ε_t стверджується і авторегресійне рівняння X_t = 1,01 X_t_-1 приймається.

Помилка прогнозу при середньоквадратичному відхиленні

σ_ε = . (4.38)

Складаємо

В_ср = ≤ t_α * = P_a_. (4.39)

При 95%-й гарантійної вірогідності t_α = 2,1 за табл. П.4[12] і помилка прогнозу не перевищить 14,42, що складає приблизно 8%:

- 14,42 ≤ 1,01 X_t-1≤ + 14,42 (4.40)

Рис. 4.3 - Одночленна авторегресійна модель:

1-вихідні дані; 2-одночленна авторегресія; 3-вирівнююча гіпербола.

Багаточленна модель. Щомісячна реалізація цегли (в тисячах штук) базою торгово – будівельних матеріалів за 20 місяців представлена в табл. 4.9 (графа 2). Треба скласти модель для прогнозування місячної потреби в цеглі на найближчі місяці.

<4 5 6 7 8 910>

Дата добавления: 2015-08-26; просмотров: 2375;