Основные операции при работе с нейронной сетью
ОСНОВЫ ПОСТРОЕНИЯ И ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТЕЙ
Данная глава предваряет рассмотрение конкретных видов нейронных сетей. В главе рассматриваются вопросы, общие для нейронных сетей различных видов: основные операции с нейронной сетью, предварительная обработка информации при формировании обучающих выборок, основные приемы конструирования сети, общие подходы к обучению сетей, обработка результатов работы сети, оценка и повышение качества работы нейросетевых моделей.
Основные операции при работе с нейронной сетью
Каждая прикладная задача, решаемая с помощью нейронных сетей, имеет особенности в представлении и обработке данных. Для каждой задачи необходимо строить свою сеть. Поэтому перед решением задачи с помощью сети должен выполняться априорный анализ объекта исследования. На этапе априорного анализа изучается объект, производится сбор данных и формирование обучающей выборки. На этапе априорного анализа необходимо привлечение специалистов конкретной предметной области (как и при интерпретации и анализе результатов).
Прежде чем строить нейронную сеть, необходимо сформировать обучающую выборку — множество входных данных и соответствующих выходных данных, на которых сеть будет обучаться и тестироваться. Реальные данные могут содержать ошибки, пропуски, могут быть представлены в разных форматах. Нейронная сеть может обрабатывать только числовые данные, а исходные данные могут включать как числа, так и качественные признаки ("больной‑здоровый", "годен‑негоден"), текстовые данные, изображения. Не все признаки, характеризующие объект исследования, оказывают одинаковое влияние на результат работы сети. Поэтому надо отбирать наиболее важные признаки. Поэтому необходима предварительная (препроцессорная) обработка данных [1, 2], заключающаяся в кодировании, масштабировании данных, заполнении пропусков данных, отборе признаков, уменьшении размерности и других операциях.
Далее необходимо определить тип и структуру сети: число слоев, число нейронов в каждом слое, вида связи между нейронами, вид функции активации. Формальных процедур построения топологии сети не существует. Используются эвристические процедуры, основанные на предшествующем опыте и переборе различных вариантов топологии и параметров сети.
Перед тем, как обучать сеть, необходимо выбрать показатели качества обучения сети и алгоритм обучения. При этом стоит задача выбора эффективных алгоритмов. Затем следует собственно обучение и оценка правильности работы сети на примерах, на которых сеть не обучалась. Тем самым проверяется способность сети к обобщению. При неудовлетворительных результатах обучения (сеть может вообще не обучиться, после обучения сеть может давать большую ошибку) необходимо выбрать другой алгоритм обучения, возможно, придется изменить структуру сети.
Нейронная сеть выдает результаты в виде чисел, поэтому необходима интерпретация ответа сети, дающая содержательную трактовку результату работы сети. Например, в задачах классификации номер нейрона выходного слоя, выдавшего максимальный сигнал, является номером класса, к которому относится предъявленный сети входной вектор. Если ответ сети представляет некоторую величину, например, прогноз курса валюты, то необходимо масштабировать выходной сигнал с учетом масштаба входных сигналов.
После получения ответа сети эксперт предметной области анализирует результат. По результатам анализа может потребоваться повторение проектирования и экспериментов с сетью. Таким образом, работа с нейронной сетью представляет собой достаточно сложный и трудно формализуемый процесс, который носит итерационный характер.
Дата добавления: 2015-12-08; просмотров: 1167;