Последовательные переделки сигнального значения дифференцировочных стимулов

Переделка сигнального значения условных раздражителей (ее ча­сто называют переделкой дифференцировки) — это разновидность дифференцированного обучения.

После достижения определенного, выбранного экспериментатором критерия выработки различения (например, 80% правильных реше­ний.) условия получения подкрепления меняются на противополож­ные: теперь реакция на стимул, ранее подкреплявшийся, перестает сопровождаться пищей, а реакцию на стимул, на который животное только что научилось не реагировать, начинают подкреплять.

Американский исследователь М. Биттерман (1973) предложил про­водить такие переделки многократно. Эта процедура получила назва­ниеметода последовательных (или обратимых)переделок (discrimination reversal learning). Автор исходил из того, что после многократных смен сигнального значения стимулов у животных может сформироваться единая стратегия (или правило), и они не будут каждый раз обучаться совершенно заново.

Опыты проводились на разных видах позвоночных. При каждой следующей переделке число ошибок снижалось, и в конце концов наступал момент, когда при очередной смене сигнального значения стимулов животное уже со второй пробы начинало выбирать «пра­вильно» без дополнительного обучения.

в Снижение числа проб, необходимого для очередной передел-| ки реакции, происходит тем быстрее, чем выше уровень эволю-в ционного развития данного животного.

3.3.2. формирование «установки на обучение»

Метод формирования«установки на обучение» (object learning-set formation) разработал американский исследователь Г. Харлоу (Harlow, 1949; 1958). Согласно классическому варианту этой методики, живот­ное (в опытах Харлоу макака-резуса) обучают простой дифференци-ровке — выбору одного из двух стимулов: игрушек или мелких пред­метов обихода. По достижении определенного критерия выработки

дифференцировки начинают следующую серию: животному предла­гают два новых стимула, ничем не похожих на первые. По завершении второй стадии обучения формируют третью дифференцировку и т.д. После выработки 100—150 таких реакций (их число зависит от уровня организации данного вида и может доходить до 1500 у крыс и голу­бей, занимая многие месяцы) животное уже при втором предъявле­нии новой пары стимулов действует не наугад, не методом проб и оши­бок, а в соответствии с усвоенным им ранее правилом, которое при­нято называтьустановкой. Оно запоминает результат первой пробы и далее реагирует в соответствии с этой «установкой».

Правило состоит в том, чтобы «выбирать тот же предмет, что и в первой пробе, если его выбор сопровождался подкреплением, или другой, если подкрепление получено не было (в дальнейшем эта стратегия получила название "win-stay, Jose-shift"}-».

Принято считать, что при обучении с использованием метода последовательных переделок и при формировании установки проис­ходят сходные процессы, так что первый можно считать частным слу­чаем формирования установки.

Впоследствии было создано несколько модификаций исходной методики. Например, Д. Уоррен (Warren, 1977) в своих опытах не вырабатывал каждую дифференцировку до достижения критерия обученности, а предъявлял каж­дую пару определенное число раз и затем предлагал следующую. Именно этот вариант был использован рядом авторов для сравнения обучаемости разных видов приматов (Passingham, 1982; Rumbaugh et al., 1987, 2000).

Методом формирования установки на обучение впервые была получена широкая сравнительная характеристика обучаемости живот­ных разных систематических групп, которая в определенной степени коррелировала с показателями организации мозга. Вместе с тем, как и данные М. Биттермана, эти результаты свидетельствовали о суще­ствовании у животных каких-то процессов, выходящих за рамки про­стого образования дифференцировочных УР. Считают, что в ходе та­кой процедуры животное «учится учиться». Оно освобождается от свя­зи «стимул-реакция» и «переходит от ассоциативного обучения к инсайт-подобному обучению с одной пробы» (Harlow, 1958). При этом, по мнению Р. Бирна (Вугпе, 1998), у животного должна сформиро­ваться характеристика подкрепляемого стимула в какой-то отвлечен­ной форме, т.е. должно сформироваться абстрактное правило. Человек выразил бы это правило, как «выбирай подкрепляемое» вместо того, чтобы запоминать каждый раз целый список стимулов (например, крас­ный мяч «+», блюдце «—»; штопор «+», свисток «—» и т.д.).

Аналогичной точки зрения придерживается Л. А. Фирсов. Он счи­тает, что этот вид обучения по своей сути и по лежащим в его основе механизмам близок к процессу обобщения (подробнее см. гл. 5), и с

какого-то момента «первичное» обучение — выработка конкретной лифференцировки — сопровождается «вторичным» обучением — не­кими когнитивными процессами, при которыхвыявляется общее пра­вило решения многих однотипных задач.

То же мнение разделяет английский специалист по теории обуче­ния Н. Макинтош (Mackintosh, 2000): в основе формирования уста­новки на обучение лежит переход от простых ассоциативных механиз­мов (образованияУР и дифференцировок) к когнитивным, т.е. к про­цессам, основанным на формировании представлений об общем правиле решения серии однотипных задач. По его образному выражению, жи­вотные «переходят от заучивания наизусть к заучиванию по смыслу».

Данные, полученные с помощью метода последовательных пе­ределок и метода формирования «установки», впервые создали основу для широкой сравнительной характеристики обучаемости животных и показали, что в процессе такого обучения наряду с ассоциативными участвуют механизмы другого уровня — когни­тивные (см. 8.1 и 3.4).








Дата добавления: 2015-06-22; просмотров: 746;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.003 сек.