Сеть Хопфилда с Хеббовскими связями
Рассмотрим интересующий нас случай сети, в которой связи вычислены по Хеббовскому правилу, исходя из вида запоминаемых векторов. В этом случае уравнения среднего поля принимают вид
.
Если сеть работает как ассоциативная память, то разумно предположить, что каждому запоминаемому вектору должно соответствовать некоторое решение системы, совпадающего с ним с точностью до постоянного множителя
.
Подставляя это выражение в уравнения среднего поля и используя предположение, что все векторы памяти не коррелированы и значения их компонент с равной вероятностью принимают значения , получим:
В пределе получаем знакомое уравнение для множителя m:
.
Вновь при высокой температуре это уравнение имеет только тривиальное решение и усредненная по времени конфигурация состояний нейронов не имеет ничего общего с запоминаемыми образами. При уравнение имеет два решения , для которых средняя конфигурация активностей указывает на одно из запоминаемых состояний , или на его “зеркального двойника” . Из этих состояний однозначно восстанавливаются образы памяти. Однако, если сделать моментальный снимок состояния сети, то в силу флуктуаций она практически никогда не находится ни в одном из состояний памяти, всегда воспроизводя их с некоторой ошибкой. Теоретически было показано, что загрузка памяти, , оказывает на поведение системы такое же влияние, как температурный параметр в распределении Ферми. Когда этот параметр мал, каждому из запоминаемых некоррелированных образов соответствует стационарное состояние сети. Однако, при приближении его к критической емкости , сеть внезапно теряет все свойства памяти. В плоскости координат области памяти и неупорядоченного поведения сети разделены границей, при пересечении которой происходит соответствующий фазовый переход. Более детальный анализ выявляет на фазовой диаграмме следующие 4 области: парамагнитную (P) фазу, в которой любой порядок разрушается высокой температурой; фазу спинового стекла (SG), в которой состояние сети не может эволюционировать к запомненным образам; смешанную (F+SG) - в ней запомненные образы метастабильны; и ферромагнитную (F) - в ней всем запоминаемым образам соответствуют глобальные минимумы энергии.
Рис. 11.6. Упрощенная и детальная диаграммы фазовых состояний сети Хопфилда
Наличие тепловых флуктуаций снижает вероятность попадания сети в состояние ложных минимумов. Критическая температура, при которых множество таких минимумов становится неустойчивыми, равна . Таким образом, тепловой шум улучшает свойства памяти и наиболее благоприятным температурным интервалом работы сети является .
C.Couvrer and P.Couvrer. “Neural Networks and Statistics: A Naive Comparison”. Belgian Journal of Operations Research, Statistics and Computer Sciences. 36, No 4, 1997
J.Tucker. “Neural Networks versus Logistic Regression in Financial Modelling: A Methodological Comparison”. http://www.bioele.nuee.nagoya-u.ac.jp/wsc1/papers/p031.html
W.S.Sarle. “Neural Networks and Statistical Models”. Proceedings of the Nineteenth Annual SAS Users Group International Conference, Cary, NC, SAS Institute, April 3-4, 1994, 1538-1550.
Заключение
Еще несколько примеров применений нейросетей в бизнесе: оценка стоимости квартир в Москве, карта состояний фондового рынка, категоризация крупнейших компаний России. Заключение
& Плохая награда учителю, если ученики его так и остаются учениками.
Ф.Ницше, Так говорил Заратустра
Лекции, составляющие этот краткий курс, конечно, далеко не исчерпывают тему. Мы успели затронуть лишь малую долю всех возможных приложений искусственных нейросетей к задачам экономики и бизнеса. Это диктовалось как ограниченным объемом данной книги, так и нашим стремлением поподробнее остановиться хотя бы на нескольких приложениях, может быть в ущерб полноте охвата.
Чтобы как-то компенсировать этот недостаток, приведем в заключении несколько дополнительных примеров нейроприложений в области экономики и бизнеса. В следующих изданиях мы надеемся поподробнее изложить и этот материал. Пока же эти примеры призваны лишь “запитать” воображение читателя, облегчив ему поиск аналогичных перспективных приложений нейротехнологий.
1 Оценка стоимости недвижимости. Нейросетевых оценщиков недвижимости можно найти в Internet, например, по адресам: http://www.neuralbench.ru/RUS/APP/REALEST.HTM - оценщик стоимости подмосковных дач, и http://canopus.lpi.msk.su/neurolab/NNgallery/NNlive/nnrieltor/Neurielt.html - оценщик стоимости квартир в Москве. Последняя программа, в создании которой один из авторов принимал непосредственное участие, представляет собой нейросеть, обученную на реальной базе данных. Пользователю достаточно заполнить стандартный бланк характеристик квартиры, включая район и степень удаленности от ближайшей станции метро, и ему мгновенно выдается средневзвешенная “рыночная” цена такой квартиры, полученная нейросетью обобщившей все накопленные в базе данные по известным предложениям.
1 Карта состояний фондового рынка. Каждый день фондового рынка характеризуется сотнями параметров - котировками всех составляющих его акций. Можно ли как-то визуализировать состояние этого рынка, ввести обобщенные координаты, наиболее полно характеризующие его? Читатель может легко убедиться, что эта задача аналогична визуализации массивов банковской информации, только вместо конкретного банка, характеризуемого своим балансом, здесь выступает исторический момент фондового рынка. В группе нейрокомпьютинга ФИАН была построена такого рода карта состояний российской торговой системы, на которой история рынка выглядит как траектория, выписывающая сложные кривые. Транспонировав базу данных, получим набор компаний-эмитентов, каждая из которых характеризуется своей историей движения акций. Теперь можно, напротив, построить самоорганизующуюся карту Кохонена всех российских компаний, кластеризующие их по степени скоррелированности рыночных движений.
1 Карта состояний российских предприятий. Предприятия характеризуются не только динамикой их ценных бумаг, но также различными экономическими показателями, отражающими его реальные успехи в бизнесе. В частности, таблицы важнейших экономических показателей двухсот самых крупных российских компаний ежегодно публикует журнал “Эксперт”. Опять же, самоорганизующиеся карты Кохонена дают возможность комплексного сравнения положения флагманов российской индустрии, позволяют обозреть российскую промышленность в целом и проанализировать тенденции ее развития.
Подобные примеры можно множить и множить. В частности, в вышедшей в 1997 году в издательстве “ТВП” книге Бэстенса, ван ден Берга и Вуда “Нейронные сети и финансовые рынки. Принятие решений в торговых операциях” можно найти дополнительные примеры применения нейросетей для прогнозирования денежных потоков и налоговых поступлений, оценки индексов акций и управления портфелями.
Мы же, напомним, в этой книге стремились выделить главные особенности новой технологии обработки данных с помощью искусственных нейросетей. Насколько это нам удалось - судить читателю. Нам же остается надеяться, что книга окажется полезной хотя бы для некоторых из них, и тем самым внесет свой вклад в распространение идей нейрокомпьютинга в России.
[1] “Достаточно сильное” изменение означает, что оно должно превосходить некоторое пороговое значение, которое может быть специфичным для каждого нейрона.
[2] Болезненность родов у человека как раз и является платой за опережающее развитие мозга, сопровождающееся увеличением его объема.
[3] Сейчас это пугающее предсказание, по-видимому, неактуально - вспомним основные параметры героев Шварценнегера.
[4] Одновременная активность большинства нейронов мозга проявляется в виде эпилептических припадков.
[5] Противоположную точку зрения, не нашедшую экспериментального подтверждения, называют как раз grandmother-cell hypothesis.
[6] Мы будем пользоваться этим "народным" термином для персональных компьютеров (Personal Computer) вместо более наукообразной аббревиатуры ПЭВМ
[7] Некоторые нейро-пакеты, впрочем, предусматривают возможность использования специальных нейро-ускорителей.
[8] Известно сравнение нейросетей с изюмом, который хорош не столько сам по себе, сколько как добавка, например, в булочки.
[9] Напомним определение идеала как принципиально недостижимой цели, к которой, тем не менее, следует стремиться.
[10] Свободный член, как мы убедимся ниже, нам не потребуется.
[11] Точнее - выходы сети Ойа являются линейными комбинациями первых главных компонент. Чтобы получить в точности сами главные компоненты достаточно в правиле Ойа заменить суммирование по всем выходам на: .
[12] Энтропия случайной величины по порядку равна логарифму характерного разброса ее значений
[13] Действительно, JPEG при ближайшем рассмотрении имеет много общего с методом главных компонент.
[14] Практически при больших размерностях осуществимы все-таки не всякие полиномиальные решения, а лишь полиномы низших степеней.
[15] Состояния аналоговых нейронов мы обозначаем латинскими буквами, тогда как состояния бинарных нейронов - греческими.
[16] В предположении, что задача определена и база данных для обучения нейросети уже собрана
[17] Здесь мы несколько упрощаем ситуацию, забывая, что участники сделки могут ориентироваться на разные временные масштабы цикла купли-продажи. Это, однако, не меняет кардинально общий вывод о сложности финансовых предсказаний.
[18] Вообще говоря, можно определить целое семейство т.н. размерностей Реньи: , определяемых через относительные числа заполнения ячеек . Причем называют размерностью Хаусдорфа, - информационной, а - корреляционной размерностями. Чем выше степень , тем меньше эффективное число ячеек, и соответственно - тем меньше размерность. Для сопоставимости с другими применениями box-counting в данных лекциях мы будем опираться на информационную размерность , численно равную энтропии, деленной на число бит данной степени разрешения .
[19] График размерностей с ростом глубины погружения не выходит на насыщение, которое зафиксировало бы существование замкнутой детерминистической системы
[20] Предсказуемость подсчитывалась методом box-counting с использованием искусственных примеров, как это будет описано чуть ниже.
[21] Напомним, что согласно нашим прошлым оценкам минимальная ошибка нейропредсказаний возрастает с ростом числа входов: , где - число примеров.
[22] Естественно, таким образом можно не только удвоить число примеров, но и учетверить их и т.д
[23] Это отношение, в принципе, может быть не малым даже при очень маленькой волатильности - за счет механизмов залоговой торговли, практикуемых на биржах
[24] Помимо явного пренебрежения комиссионными, вызывает сомнения само предположение о постоянном перевложении капитала. В более реалистичной игре на фиксированном капитале экспоненциальный рост сменяется линейным.
[25] В момент написания этих строк рейтинг России был B+ в классификации агентства Standard & Poor's
[26] Для рейтинга облигаций из класса AA по классификации Standard & Poor's.
[27] Заметим , что само понятие неожиданной прибыли подразумевает какую-то модель прогнозирования прибыли. Чем адекватнее будет прогноз, тем значимее информация об отличной от ожидаемой прибыли, свидетельствующая о каких-то существеных изменениях в характере функционирования фирмы.
[28] Биологическая эволюция демонстрирует многочисленные примеры "слишком успешной" адаптации к определенной экологической нише, приводящей к быстрому вымиранию при резком изменении условий внешней среды.
[29] Наше изложение будет следовать работе (Shumsky, Yarovoy, 1998), выполненной по заказу и при финансовой поддержке агентства "Прайм".
[30] К сожалению, в черно-белом варианте раскрасок многие эффекты не наблюдаются
Дата добавления: 2015-04-10; просмотров: 1067;