Сравнительная оценка производительности нейронных сетей
В идеальном варианте нейронную сеть нужно обучать и применять в моделировании нелинейных систем с постоянной (во времени) структурой и при наличии достаточного объема представительных данных. В этих случаях нейронные сети имеют преимущество перед более простыми методами: экспоненциальным, ARIMA и множественной регрессии.
К сожалению, на практике такие ситуации встречаются нечасто, и, даже если так случайно получилось, требования к надежности решения сводят на нет преимущества модели.
В этом разделе мы исследуем характеристики качества работы нейронных сетей в сравнении с другими методами на примере 18 временных рядов, соответствующих различным показателям экономики Великобритании. Тестовые данные состоят из 18 ежемесячных и 10 ежеквартальных показателей. Все они взяты из базы данных Министерства статистики, имеющейся на базовом компьютере Манчестерского университета.
Предварительная обработка
После загрузки данных в электронную таблицу они были исследованы на присутствие сезонных колебаний (с периодами 1 квартал и 1 год). Там, где сезонные колебания присутствовали, соответствующий показатель брался в качестве одного из входов сети. Входы были линейно масштабированы так, чтобы их значения находились между 0 и 1. Из данных 70% использовалось в качестве обучающего множества, а оставшиеся 30% – для оценки.
Обучение
В отсутствие априорной информации о структуре обучение начиналось с наиболее простой модели: с одним входным, одним скрытым и одним выходным слоем. Далее модель расширялась вплоть до 6-входовой модели с двумя скрытыми слоями, четырьмя узлами в первом слое и двумя во втором. Во всех случаях вполне хватало одного выходного узла.
Обучение заняло 1000 эпох, причем коэффициенты, определяющие величину шага, на первом уровне полагались равными единице, деленной на число входных узлов, а на втором уровне – вдвое меньше. Использовалась логистическая функция обучения, и результат был лучше, чем для линейной функции, гиперболического тангенса и гауссовой функции.
Таблица 2.3
Перечень переменных
BCJA | Общее число безработных, тыс. |
BFKF BFKA BFKI BGAA BFNK BMIB BMIA AIJA BHCD BIAH BHIA BHCB BMLA BMGA BIFF (S1) BIFF (S2) FTAE | Производство сыра, тонн Поставки молока, тыс. гектолитров Производство сухого молока, тонн Объём импорта, млн. ф. ст. Производство домашнего пива, тыс. гектолитров Туристические поездки, тыс. Суммарная дальность авиарейсов из Великобритании,тыс. км Совокупный доход частных лиц, млн. ф. ст. Производство электроэнергии, квт. ч. Поставки комбикормов фермерам, тыс. тонн Потребление газа, тыс. куб.м. Поставка нефти, тонн Объём пассажирских морских перевозок, тыс. Объём железнодорожных пассажирских перевозок, тыс. Производство формальдегида, тыс. тонн, не SA Производство формальдегида, тыс. тонн, не SA Потребление электроэнергии промышленностью, квт.ч. |
Результаты работы
Значения, полученные на выходе, преобразовывались обратно в исходный масштаб и анализировались на предмет среднего значения, средней квадратичной ошибки, абсолютной средней ошибки, средней относительной (процентной) ошибки, и показателей Theils m.
Прогнозы, которые выдавала сеть, сравнивались с результатами расчетов по другим моделям обработки временных рядов из пакета SPSS РС+. В их числе были различные методы авторегрессии, в том числе методы Холта-Уинтерса и Бокса-Дженкинса. В табл. 2.4 приведены результаты сравнения в терминах Theils m.
Таблица 2.4
Результаты сравнения
Показатель | Переодичность | Без учёта сезонности | С учётом сезонности | Бокс Дженкинс | Нейронная сеть |
BCJA BFKF BFKA BFKI BGAA BFNK BMIB BMIA AIIA BHCD BIAH BHIA BHCB BMLA BMGA BIFF (S1) BIFF (S2) FTAE | M M M M M M M M Q Q Q Q Q Q Q Q Q Q | 2.64 (DN) 1.38 (DN) - 1.86 (DN) - 1.12 (DN) 4.37 (DN) - 0.64 (Holt) - - 0.17 (DN) 1.08 (DN) 0.73 (DN) 0.84 (DN) 1.774 (LN) 0.98 (LN 1.09 (DN) | 1.05 (DM) - 1.08 (DN) 1.35 (DN) 0.35 (DM) 0.69 (DM) 0.45 (DM) 0.56 (DM) 0.81 (LN) 1.30 (NM) - 3.39 (DM) - 0.59 (DM) - - 0.42 (DM) | 1.05 0.82 0.68 1.11 0.30 1.24 1.66 1.74 0.82 0.91 2.74 0.14 0.96 0.44 0.65 2.06 0.94 0.33 | 1.08 0.18 0.13 0.53 0.15 0.09 0.44 0.37 1.87 0.41 0.24 0.11 0.98 0.40 0.41 0.19 0.17 0.40 |
DM – тренд убран, мультипликативная сезонность
DN – тренд убран, сезонность не учитывается
Holt – Холт – Джекинс, линейная, сезонность не учитывается
LN – линейный тренд, сезонность не учитывается
NM – мультипликативная сезонность, тренд не учитывается
Результаты анализа столь представительного набора рядов различных экономических показателей оказались весьма обнадеживающими: из 10 ежеквартальных показателей в трех случаях нейронные сети продемонстрировали примерно такую же эффективность, как и модель Бокса-Дженкинса, в шести случаях – лучшую, и только в одном – для доходов частных лиц – заметно худшую.
Для семи из восьми рядов ежемесячных показателей сеть дала значительно лучшие результаты, чем модель Бокса-Дженкинса ARIMA, и в одном случае ошибки были одного порядка. Суммируя результаты по всем 18 рядам, можно сказать, что стандартная модель нейронной сети очень хорошо справилась с анализом экономических показателей, имеющих различную периодичность, характер сезонных изменений и выражение (натурное либо денежное). Результаты работы модели существенно лучше, чем у авторегрессионных моделей и модели Бокса-Дженкинса. Этот эксперимент показал, что значительные затраты времени на построение и обучение нейронной сети вполне себя оправдывают.
Нейронно-сетевые модели можно совершенствовать еще и еще, но даже при относительно простом подходе получается довольно устойчивая архитектура. При обработке реальных данных, с шумом и меняющейся структурой, всегда приходится заботиться о том, чтобы не происходило переобучение, и универсальные (а не сделанные специально для данного ряда) модели дают в этом смысле определенную защиту.
Дата добавления: 2015-09-18; просмотров: 1097;