Последовательные переделки сигнального значения дифференцировочных стимулов

Переделка сигнального значения условных раздражителей (ее часто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.

После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80% правильных решений.) условия получения подкрепления меняются на противоположные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.

Американский исследователь М. Биттерман (1973) предложил проводить такие переделки многократно. Эта процедура получила названиеметода последовательных (или обратимых)переделок (discrimination reversal learning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.

Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «правильно» без дополнительного обучения.

^в Снижение числа проб, необходимого для очередной передел-| ки реакции, происходит тем быстрее, чем выше уровень эволю-в ционного развития данного животного.

3.3.2. формирование «установки на обучение»

Метод формирования«установки на обучение» (object learning-set formation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, животное (в опытах Харлоу макака-резуса) обучают простой дифференци-ровке — выбору одного из двух стимулов: игрушек или мелких предметов обихода. По достижении определенного критерия выработки

дифференцировки начинают следующую серию: животному предлагают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т.д. После выработки 100—150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голубей, занимая многие месяцы) животное уже при втором предъявлении новой пары стимулов действует не наугад, не методом проб и ошибок, а в соответствии с усвоенным им ранее правилом, которое принято называтьустановкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».

Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, Jose-shift"}-».

Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки происходят сходные процессы, так что первый можно считать частным случаем формирования установки.

Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каждую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).

Методом формирования установки на обучение впервые была получена широкая сравнительная характеристика обучаемости животных разных систематических групп, которая в определенной степени коррелировала с показателями организации мозга. Вместе с тем, как и данные М. Биттермана, эти результаты свидетельствовали о существовании у животных каких-то процессов, выходящих за рамки простого образования дифференцировочных УР. Считают, что в ходе такой процедуры животное «учится учиться». Оно освобождается от связи «стимул-реакция» и «переходит от ассоциативного обучения к инсайт-подобному обучению с одной пробы» (Harlow, 1958). При этом, по мнению Р. Бирна (Вугпе, 1998), у животного должна сформироваться характеристика подкрепляемого стимула в какой-то отвлеченной форме, т.е. должно сформироваться абстрактное правило. Человек выразил бы это правило, как «выбирай подкрепляемое» вместо того, чтобы запоминать каждый раз целый список стимулов (например, красный мяч «+», блюдце «—»; штопор «+», свисток «—» и т.д.).

Аналогичной точки зрения придерживается Л. А. Фирсов. Он считает, что этот вид обучения по своей сути и по лежащим в его основе механизмам близок к процессу обобщения (подробнее см. гл. 5), и с

какого-то момента «первичное» обучение — выработка конкретной лифференцировки — сопровождается «вторичным» обучением — некими когнитивными процессами, при которыхвыявляется общее правило решения многих однотипных задач.

То же мнение разделяет английский специалист по теории обучения Н. Макинтош (Mackintosh, 2000): в основе формирования установки на обучение лежит переход от простых ассоциативных механизмов (образованияУР и дифференцировок) к когнитивным, т.е. к процессам, основанным на формировании представлений об общем правиле решения серии однотипных задач. По его образному выражению, животные «переходят от заучивания наизусть к заучиванию по смыслу».

Данные, полученные с помощью метода последовательных переделок и метода формирования «установки», впервые создали основу для широкой сравнительной характеристики обучаемости животных и показали, что в процессе такого обучения наряду с ассоциативными участвуют механизмы другого уровня — когнитивные (см. 8.1 и 3.4).

<27 28 293031 32 33 >

Дата добавления: 2015-10-19; просмотров: 869;