Структура и свойства искусственного нейрона

Нейрон – это составная часть нейронной сети. На рис. 1.2 показана его структура.

 

.

 

Рис. 1.2. Структура искусственного нейрона

В состав нейрона входят умножители (синапсы), сумматор и нелинейный преобразователь. Синапсы осуществляют связь между нейронами и умножают входной сигнал на число, характеризующее силу связи, - вес синапса. Сумматор выполняет сложение сигналов, поступающих по синаптическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию одного аргумента - выхода сумматора. Эта функция называется "функция активации" или "передаточная функция" нейрона. Нейрон в целом реализует скалярную функцию векторного аргумента.

Математическая модель нейрона описывается соотношениями:

y = f(s),

где wi – вес синапса , (i = 1…n); b – значение смещения; s – результат суммирования; xi – компонента входного вектора (входной сигнал), (i = 1…n); y – выходной сигнал нейрона; n – число входов нейрона; f – нелинейное преобразование (функция активации или передаточная функция).

В общем случае, входной сигнал, весовые коэффициенты и значения смещения могут принимать действительные значения. Выход (y) определяется видом функции активации и может быть как действительным, так и целым. Во многих практических задачах входы, веса и смещения могут принимать лишь некоторые фиксированные значения.

Синаптические связи с положительными весами называют возбуждающими, с отрицательными весами – тормозящими.

Таким образом, нейрон полностью описывается своими весами wi и передаточной функцией f(s). Получив набор чисел (вектор) xi в качестве входов, нейрон выдает некоторое число y на выходе.

Описанный вычислительный элемент можно считать упрощенной математической моделью биологических нейронов – клеток, из которых состоит нервная система человека и животных.

Чтобы подчеркнуть различие нейронов биологических и математических, вторые иногда называют нейроноподобными элементами или формальными нейронами.

На входной сигнал (s) нелинейный преобразователь отвечает выходным сигналом f(s), который представляет из себя выход нейрона y.

Примеры активационных функций представлены в табл. 1.1 и на рис. 1.3.

Таблица 1.1

Виды функций активации нейронов

 

Название Формула Область значений
Пороговая 0, 1
Знаковая (сигнатурная) -1, 1
Сигмоидальная (логистическая)   (0, 1)
Полулинейная
Линейная f(s) = s
Радиальная базисная (гауссова) (0, 1)
Полулинейная с насыщением (0, 1)
Линейная с насыщением  
Гиперболический тангенс (сигмоидальная)  
Треугольная (0, 1)

 

Рис. 1.3. Примеры активационных функций: а) функция единичного скач­ка;

б) линейный порог (гис­те­ре­зис); в) сигмоид – гипербо­ли­ческий тангенс;

г) сигмоид – логистическая

 

Одной из наиболее распространенных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида):

.

При уменьшении a сигмоид становится более пологим, в пределе при a=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении a сигмоид приближается по внешнему виду к функции единичного скачка с порогом в точке s=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем:

 

.

Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон. Поэтому, в силу монотонности и всюду дифференцируемости сигмоидная функция является наиболее распространённой.

Возвращаясь к общим чертам, присущим всем НС, отметим принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

Радиально-базисная функция активации (radbas(S)) характеризуется функцией Гаусса для нормального закона распределения, в соответствии с которой:

,

где s – cреднеквадратичное отклонение, характеризующее крутизну радиально-базисной функции (рис.1.4). Величина s определяется в соответствии с евклидовым расстоянием между входным и весовым векторами:

S2 =|X-W|2 = .

 
 

Наряду с перечисленными функциями могут использоваться и другие функции активации, например, логарифмическая функция.

 

Рис. 1.4. Радиально-базисная функция

Многомерные радиальные распределения позволяют производить многомерный анализ путем сведения его к анализу одномерных симметричных распределений, таких как многомерное нормальное распределение или равномерное в шаре с центром в начале координат.

 








Дата добавления: 2016-02-24; просмотров: 2665;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.01 сек.