Властивості нейронних мереж
Як наголошувалося, штучна нейронна мережа (ШНМ, нейромережа) – це набір нейронів, сполучених між собою. Як правило, передавальні (активаційні) функції всіх нейронів у мережі фіксовані, а вага є параметрами мережі і може змінюватися.
Деякі входи нейронів помічені як зовнішні входи мережі, а деякі виходи – як зовнішні виходи мережі. Подаючи будь-які числа на входи мережі, ми одержуємо якийсь набір чисел на виходах мережі.
Таким чином, робота нейромережі полягає у перетворенні вхідного вектора X у вихідний вектор Y, причому це перетворення задається вагами мережі.
Практично будь-яку задачу можна звести до задачі, вирішуваної нейромережею. В таблці 3.1 показано, яким чином потрібно сформулювати у термінах нейромережі задачу розпізнавання рукописних букв.
Пояснимо, навіщо вимагається вибирати вихід з максимальним рівнем сигналу. Річ у тому, що рівень вихідного сигналу, як правило, може приймати будь-які значення з якогось відрізка.
Проте в даній задачі нас цікавить не аналогова відповідь, а всього лише номер категорії (номер букви в алфавіті). Тому використовується наступний підхід – кожній категорії зіставляється свій вихід, а відповіддю мережі вважається та категорія, на чиєму виході рівень сигналу максимальний. У певному значенні рівень сигналу на виході «А» – це достовірність того, що на вхід була подана рукописна буква «A».
Задачі, в яких потрібно віднести вхідні дані до однієї з відомих категорій, називаються задачами класифікації.
Висловлений підхід – стандартний спосіб класифікації за допомогою нейронних мереж.
Таблиця 3.1. Задача розпізнавання рукописних букв в термінах нейромереж
Задача розпізнавання рукописних букв | |
Дано: растрове чорно-біле зображення букви розміром 30´30 пікселів | Потрібно: визначити яка буква представлена (у алфавіті 32 букви) |
Формулювання для нейромережі | |
Дано:вхідний вектор з 900 двійкових символів (900 = 30´30) | Потрібно:побудувати нейромережу із 900 входами і 33 виходами, які помічені буквами. Якщо на вході мережі – зображення букви «А», то максимальне значення вихідного сигналу має встановлюватись на виході «А» |
Тепер, коли стало ясно, що саме ми хочемо побудувати, ми можемо переходити до питання “як будувати таку мережу”. Це питання розв'язується у два етапи.
1. Вибір типу (архітектура) мережі.
2. Підбір ваг (навчання) мережі.
На першому етапі слід вибрати наступне:
- які нейрони ми хочемо використовувати (число входів, передаточні функції);
- яким чином слід з'єднати їх між собою;
- що узяти як входи і виходи мережі.
Ця задача на перший погляд здається невирішуваною, але, нам не обов'язково придумувати нейромережу «з нуля» – існує декілька десятків різних нейромережевих архітектур, причому ефективність багатьох з них доведена математично.
Найпопулярніші і найвивченіші архітектура – це багатошаровий персептрон, нейромережа із загальною регресією, мережі Кохонена.
На другому етапі нам слід «навчити» вибрану мережу, тобто підібрати такі значення її ваг, щоб мережа працювала потрібним чином. Ненавчена мережа подібна дитині – її можна навчити чому завгодно. У тих нейромережах, що використовуються на практиці, кількість ваг може складати декілька десятків тисяч, тому навчання – складний процес. Для багатьох архітектур розроблені спеціальні алгоритми навчання, які дозволяють налаштувати ваги мережі певним чином.
Залежно від функцій, виконуваних нейронами в мережі, можна виділити три їх типи:
- вхідні нейрони – це нейрони, на які подається вхідной вектор, що кодує вхідну дію або образ зовнішнього середовища; у них звичайно не здійснюється обчислювальних процедур, інформація передається з входу на вихід нейрона шляхом змінення його активації;
- вихідні нейрони – це нейрони, вихідні значення яких представляють вихід мережі;
- проміжні нейрони – це нейрони, що становлять основу штучних нейронних мереж.
У більшості нейронних моделей тип нейрона пов'язаний з його розміщенням в мережі. Якщо нейрон має тільки вихідні зв'язки, то це вхідний нейрон, якщо навпаки – вихідний нейрон.
Проте може зустрітися випадок, коли вихід топологічно внутрішнього нейрона розглядається як частина виходу мережі. У процесі функціонування (еволюції стану) мережі здійснюється перетворення вхідного вектора у вихідний, тобто деяка переробка інформації.
Контрольні питання
1. Що таке штучна нейронна мережа?
2. У чім полягає робота штучної нейронної мережі?
3. Наведіть етапи побудови нейромереж.
4. Класифікуйте нейрони функціонально та топологічно.
Дата добавления: 2015-10-13; просмотров: 1951;