Структура и свойства искусственного нейрона

Нейрон – это составная часть нейронной сети. На рис. 1.2 показана его структура.

Рис. 1.2. Структура искусственного нейрона

В состав нейрона входят умножители (синапсы), сумматор и нелинейный преобразователь. Синапсы осуществляют связь между нейронами и умножают входной сигнал на число, характеризующее силу связи, - вес синапса. Сумматор выполняет сложение сигналов, поступающих по синаптическим связям от других нейронов, и внешних входных сигналов. Нелинейный преобразователь реализует нелинейную функцию одного аргумента - выхода сумматора. Эта функция называется "функция активации" или "передаточная функция" нейрона. Нейрон в целом реализует скалярную функцию векторного аргумента.

Математическая модель нейрона описывается соотношениями:

y = f(s),

где w_i – вес синапса , (i = 1…n); b – значение смещения; s – результат суммирования; x_i – компонента входного вектора (входной сигнал), (i = 1…n); y – выходной сигнал нейрона; n – число входов нейрона; f – нелинейное преобразование (функция активации или передаточная функция).

В общем случае, входной сигнал, весовые коэффициенты и значения смещения могут принимать действительные значения. Выход (y) определяется видом функции активации и может быть как действительным, так и целым. Во многих практических задачах входы, веса и смещения могут принимать лишь некоторые фиксированные значения.

Синаптические связи с положительными весами называют возбуждающими, с отрицательными весами – тормозящими.

Таким образом, нейрон полностью описывается своими весами w_i и передаточной функцией f(s). Получив набор чисел (вектор) x_i в качестве входов, нейрон выдает некоторое число y на выходе.

Описанный вычислительный элемент можно считать упрощенной математической моделью биологических нейронов – клеток, из которых состоит нервная система человека и животных.

Чтобы подчеркнуть различие нейронов биологических и математических, вторые иногда называют нейроноподобными элементами или формальными нейронами.

На входной сигнал (s) нелинейный преобразователь отвечает выходным сигналом f(s), который представляет из себя выход нейрона y.

Примеры активационных функций представлены в табл. 1.1 и на рис. 1.3.

Таблица 1.1

Виды функций активации нейронов

Название	Формула	Область значений
Пороговая		0, 1
Знаковая (сигнатурная)		-1, 1
Сигмоидальная (логистическая)		(0, 1)
Полулинейная
Линейная	f(s) = s
Радиальная базисная (гауссова)		(0, 1)
Полулинейная с насыщением		(0, 1)
Линейная с насыщением
Гиперболический тангенс (сигмоидальная)
Треугольная		(0, 1)

Рис. 1.3. Примеры активационных функций: а) функция единичного скачка;

б) линейный порог (гистерезис); в) сигмоид – гиперболический тангенс;

г) сигмоид – логистическая

Одной из наиболее распространенных является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида):

При уменьшении a сигмоид становится более пологим, в пределе при a=0 вырождаясь в горизонтальную линию на уровне 0.5, при увеличении a сигмоид приближается по внешнему виду к функции единичного скачка с порогом в точке s=0. Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции – простое выражение для ее производной, применение которого будет рассмотрено в дальнейшем:

Следует отметить, что сигмоидная функция дифференцируема на всей оси абсцисс, что используется в некоторых алгоритмах обучения. Кроме того она обладает свойством усиливать слабые сигналы лучше, чем большие, и предотвращает насыщение от больших сигналов, так как они соответствуют областям аргументов, где сигмоид имеет пологий наклон. Поэтому, в силу монотонности и всюду дифференцируемости сигмоидная функция является наиболее распространённой.

Возвращаясь к общим чертам, присущим всем НС, отметим принцип параллельной обработки сигналов, который достигается путем объединения большого числа нейронов в так называемые слои и соединения определенным образом нейронов различных слоев, а также, в некоторых конфигурациях, и нейронов одного слоя между собой, причем обработка взаимодействия всех нейронов ведется послойно.

Радиально-базисная функция активации (radbas(S)) характеризуется функцией Гаусса для нормального закона распределения, в соответствии с которой:

где s – cреднеквадратичное отклонение, характеризующее крутизну радиально-базисной функции (рис.1.4). Величина s определяется в соответствии с евклидовым расстоянием между входным и весовым векторами:

S2 =|X-W|² = .

Наряду с перечисленными функциями могут использоваться и другие функции активации, например, логарифмическая функция.

Рис. 1.4. Радиально-базисная функция

Многомерные радиальные распределения позволяют производить многомерный анализ путем сведения его к анализу одномерных симметричных распределений, таких как многомерное нормальное распределение или равномерное в шаре с центром в начале координат.

1 2 34

Дата добавления: 2016-02-24; просмотров: 2804;