Сравнение индивидуального и систематического вклада переменных
Достаточно широко распространено мнение, что нейронные сети не дают ничего для понимания пользователем сути проблемы и, в отличие от регрессионного анализа, который выдает ряд статистик по каждой переменной, остаются «черным ящиком». В этой связи в данном разделе приводятся результаты исследования факторов, влияющих на решение, которое принимает сеть. В идеале следовало бы выяснить значимость либо не значимость отдельного вклада каждой из переменных и предоставить лицу, принимающему решение, возможность самому разбивать переменные по категориям в соответствии с их поведением во времени при различных обстоятельствах.
Представим себе, например, переменную, которая влияет на выход (доход по индексу курсов акций) только на одной из фаз делового цикла (скажем, при понижении конъюнктуры рынка, но не при подъеме, или же наоборот). Общий (усредненный) ее вклад может быть незначительным, и OLS-регрессия, скорее всего, квалифицирует эту переменную как несущественную. Теперь представим себе, что некоторая переменная активна во всех фазах цикла, но в разные фазы действует в разных направлениях (например, переменная, усиливающая тенденцию рынка и на его подъеме, и на спаде). Такое типично нелинейное поведение может остаться совершенно незамеченным OLS-регрессией, но MBPN-сеть, скорее всего, его уловит. Далее, предположим, что переменная активна во всех фазах делового цикла и действует в том же направлении, что и движется рынок (например, увеличивает доходы во время роста активности на рынке и уменьшает их при понижении рынка). Вероятно, и сеть, и регрессия скажут, что эта переменная значима. Итак, классификация переменных в соответствии с их вкладом (поведением) во времени может пролить свет на механизмы происхождения дохода от акций.
Коль скоро OLS-регрессия не всегда способна уловить все имеющиеся функциональные связи между независимыми и зависимыми переменными, нужно искать другие пути к пониманию поведения переменных. Отметим два интуитивных эвристических подходах. В первом из них важность переменной оценивается путем сравнения погрешности прогноза, полученного при исходной входной матрице, с погрешностью, которая получится, если значения всех переменных заменить на их средние значения. Во втором - вклад отдельной переменной оценивается по степени надежности выхода сети (decisiveness). Метод работает «наперед» (ex ante), не обращаясь к реальным значениям целевой переменной или погрешности. Его недостаток состоит в том, что переменные могут быть классифицированы в соответствии с тем, поддерживают или противоречат ли они выдаваемому решению, а это решение на самом деле может быть неправильным.
Дата добавления: 2015-09-18; просмотров: 719;