Рекомендации по выполнению работы
А. Описание задачи
На основе предъявленного образа (графического файла) требуется автоматическое определение цифры, изображенной в файле.
Поэтапно процедура разработки и обучения сети выглядит следующим образом.
Этап 1. Определение характеристик распознаваемых образов:
· тип распознаваемых образов – растровый графический файл;
· набор измеряемых параметров образов – образ задается совокупностью пикселей, каждый из которых характеризуется интенсивностью красного, зеленого и синего цветов (модель RGB);
· классы распознаваемых образов – цифры от 0 до 9 (10 классов).
Этап 2. Изображение, находящееся в файле, можно пропустить через «черно-белый» фильтр, разбить на стандартное количество одинаковых сегментов (например, заданных матрицей 8 × 10) и определить для каждого сегмента преобладающий цвет (черный или белый).
Таким образом, вектор входных величин сети для отдельного распознаваемого образа (файла) будет состоять из одного и того же количества элементов (8 × 10 = 80 элементов), каждый из которых может принимать значения: 1 (цвет сегмента черный) или 0 (цвет сегмента белый).
Рис. 48. Преобразование исходного образа
Количество элементов вектора выходных величин будет соответствовать количеству классов распознаваемых образов. Значения элементов вектора нормализованы и равны 1 (признак принадлежности к классу) или 0 (в противном случае).
Этап 3. Проектирование архитектуры искусственной нейронной сети:
· количество слоев – 3;
· количество нейронов в слое:
o входном – 80;
o промежуточном – 40;
o выходном – 10;
· тип связей между нейронами – прямые;
· функция активации – сигмоидальная .
· первая производная функции активации – .
Этап 4. Обучение сети выполняется с помощью алгоритма с обратным распространением ошибки.
Для обучения экспертом приготовлено 20 обучающих образов – по два на каждый класс (цифру), один из которых эталонный (идеальный) и один с незначительной модификацией. Каждый образ характеризуется строго определенными векторами входных и выходных величин. Вектор входных величин соответствует преобразованному обучающему образу (файлу) и состоит из 80 элементов, значения которых 0 или 1 согласно цвету сегмента. Вектор выходных величин соответствует классу, которому принадлежит образ, и состоит из 10 элементов, значения которых равны 1 или 0. Так, для обучающего образа цифры «0» вектор выходных величин –
[1, 0, 0, 0, 0, 0, 0, 0, 0, 0].
Перед процедурой обучения весовые коэффициенты всех связей инициализируются малыми случайными значениями в диапазоне [-0.3, 0.3].
При обучении все 20 образов последовательно прогоняются через сеть с корректировкой весовых коэффициентов после прогона каждого образа. Данная процедура повторяется 500 раз (количество эпох – 500). Норма обучения принята равной 0.1.
Этап 5. Тестирование сети выполняется с помощью контрольных образов. Например, если на вход сети был подан образ цифры «2», а на выходе получен вектор [0 0.11 0.76 0.23 0.01 0.05 0 0 0 0.25], то распознавание прошло успешно.
Дата добавления: 2017-09-19; просмотров: 361;