Как собаки учатся
Собака, предоставленная самой себе, обучается методом проб и ошибок. Пытаясь перебраться через ограждение вокруг фермы, где щели между натянутой рядами проволокой становятся с высотой все шире и шире, она будет изо всех сил пытаться просунуть голову между нижними рядами. Наконец, отчаявшись, может встать на задние конечности, обнаружить, что промежутки наверху достаточно широки, и выбраться, ворочаясь и протискиваясь. Совершив еще несколько точно таких же попыток преодолеть ту же преграду, она от них откажется и отныне начнет подниматься на задних конечностях, просовывать в щель голову и выпрыгивать. В конце концов даже научится не трудиться, а, отыскав щель, отойдет в сторону, прыгнет, оттолкнувшись задними конечностями, и будет проделывать это столь грациозно, что смотреть на нее одно удовольствие.
Ощущая болезненную реакцию, она усваивает, чего делать не следует. С раннего детства собака осознает, что рычание «матери» означает: нельзя, держись подальше. Каким образом она учится? Слышит рычание, продолжает делать то, что запрещено, чувствует, как «материнские» клыки причиняют боль и нагоняют жуткий страх. Рычание как будто ставит перед щенком преграду. «Мать» ест и рычит. Если щенок держится на расстоянии, то останется в безопасности, но горе ему, если он пересечет невидимую черту. А разве вы никогда не видели, как щенок подражает «матери» и рычит, не подпуская однопометников к еде? Щенкам исполняется несколько недель, прежде чем они начинают охранять пищу. И эта реакция проявляется, даже когда их выкармливают из бутылочки.
Как собака учится? И что она узнает? Что на лай собирается дружеская компания? Что лай изгоняет людей из ее владений? Что надо подавать лапу, обмениваясь рукопожатием? Что огонь жжется? Что пить надо из миски? Что пчелы жалят? Что дикобраз отличается от других животных? Нелегко определить это понятие – обучение. Вполне можно предположить, что сфера обучения равнозначна сфере психологии.
Психологи с каждым днем узнают об обучении все больше и больше и будут продолжать исследования. Не пытаясь предлагать никаких определений, мы можем сказать, что с помощью тщательного изучения собак получили сейчас в свое распоряжение средства и методы, которые позволяют оказывать глубокое воздействие на их поведение и добиваться через определенный период времени повторяемых результатов. Поведение собак демонстрирует, чему они научились. Наша задача – повлиять на собаку так, чтобы она вела себя соответственно нашим желаниям. Когда мы формируем ее поведение, она учится исключать неприемлемые поступки и закреплять приемлемые.
Крайне необходимо понять определенные психологические принципы, даже если для этого потребуются значительные усилия.
Как мы видели, существуют два типа поведения – рефлекторное и индивидуальное, «волюнтаристское». Многие психологи по разным причинам считают термины «рефлекторное» и «индивидуальное» ошибочными и вместо «рефлекторное» говорят «реактивное», а вместо «индивидуальное» – «оперантное»[42] или «инструментальное». Мы в этой книге будем пользоваться старыми терминами, которые вполне применимы к собакам, а понятия «реактивное» и «оперантное» приводим лишь для того, чтобы, где-нибудь встретившись с ними, вы знали, что они означают.
В качестве яркого примера рефлекторного поведения проведем эксперимент, который используется при обучении студентов в психологических лабораториях. По звуковому сигналу студент опускает правую руку в сосуд с ледяной водой. Естественно, кровеносные сосуды в руке сужаются, температура падает. Это отражается и на левой руке, не опущенной в воду. Каждые пять минут звучит сигнал, и правая рука окунается в холодную воду. Примерно после двенадцатого сигнала руку в воду не опускают. Что происходит? Температура руки все равно падает – возник условный рефлекс.
Павлов называл свой метроном «нейтральным стимулятором», другие называют его «условным». В описанном выше случае сигнал представляет собой нейтральный или условный стимул, холодная вода – реактивный стимул, а понижение температуры – результат. Состояние, возникающее после повторяющихся опытов, представляет собой условный рефлекс. Использующуюся в ходе экспериментов еду Павлов называл «подкреплением» (можно также назвать ее наградой).
Подкрепляющие стимулы бывают позитивными и негативными. Пища и вода, например, позитивные стимулы, электрошок или удар хлыста – негативные. Реакции собак могут медленно подкрепляться одним лишь выраженным хозяином одобрением или неодобрением. Из разговоров между владельцами собак можно, кажется, заключить, что, по их убеждению, для эффективной дрессировки ничего более и не требуется, кроме похвал и упреков. Двое авторов, имеющих ошибочное представление о натуре собак, пишут в книге, что собаки, мол, не тюлени, которых надо подкармливать после каждого совершенного ими поступка. Если бы выражения одобрения или неодобрения было достаточно, почему тогда 99 процентов собак остаются почти совсем невоспитанными?
Далее в этой главе будут описаны наиболее действенные при дрессировке собак способы подкрепления.
Надеюсь, я доходчиво объяснил, что такое рефлекс, условный рефлекс и условный раздражитель или условный стимул. Если нет, вспомним, что пища, положенная собаке в пасть, представляет собой стимул, на который она реагирует, пуская слюну, и что это безусловный рефлекс, врожденный и не нуждающийся в усвоении. Когда сопровождавший появление еды звонок заставляет собаку пускать слюну, не ощущая и даже не видя пищи, он становится условным стимулом, а выделение у собаки слюны при звонке – условным рефлексом.
Множество разнообразных стимулов, даже время, можно сделать условными. Голодной собаке каждые двадцать минут дают понемногу еды, и через какое-то время у нее начнет каждые двадцать минут выделяться слюна, независимо от того, получает она еду или нет.
Другой принцип, который необходимо знать дрессировщику, состоит в следующем: условный стимул должен поступать вслед за реактивным. Если их разделяет слишком большой период времени, условного рефлекса может вообще не возникнуть или он будет формироваться гораздо дольше. Промежуток между получением стимулов должен измеряться в секундах, и ученик сразу же после этого должен получать подкрепление – принцип одновременности или, на мой взгляд, точнее сказать, последовательности. Дрессировка заключается в том, что мы пытаемся вызвать новую реакцию на новый стимул. Это можно сделать как позитивным, так и негативным образом.
Еще один принцип предложен американским психологом Торндайком: любое действие можно изменить с помощью его последствий. Если собака прыгает, ставя передние лапы на край стола, а оттуда на пол с громким стуком падает пустая банка, она пугается. Если при таком прыжке ей на голову с шумом свалится целая коробка с пустыми банками, это произведет столь жуткое впечатление, что она вряд ли попробует еще раз прыгнуть, тогда как после падения одной банки последующие попытки возможны.
Порой собака, напав на другую и получив легкий укус, практически его не чувствует. Но если напасть на бультерьера и тот в ярости «порвет ее на куски», оставив кровавые раны, едва ли она в другой раз решится атаковать бультерьера.
Подкрепление бывает как негативным, так и позитивным. Но и позитивное и негативное подкрепления фиксируют последовавшую реакцию и подавляют неправильные поступки.
Это подводит нас к проблеме утраты или, как говорят психологи, «угасания» рефлексов или следов памяти. Владельцы собак называют это просто пресечением дурных привычек. Механизм угасания помогает собаке утрачивать дурную привычку – и мы помогаем, не предлагая подкрепления. Но для этого нужно время. Если подкрепление не предлагается достаточно долго, дурная привычка или неправильный поступок исчезают. Некоторые называют это «промыванием мозгов». Так оно и есть, только мозги промываются медленно.
«Промывание мозгов»
Часто можно услышать, как один человек говорит о другом: «О, ему как следует промыли мозги». Это в действительности означает, что кого-то соответствующим образом перевоспитали, а вовсе не промывали мозги. «Промывание мозгов» представляет собой процесс стирания в памяти того, что усвоило животное. Один применяющийся в этих целях способ заключается в создании столь устрашающей ситуации, чтобы собака в конце концов полностью «потеряла рассудок». Великие проповедники, даже не понимая, на чем этот способ основан, использовали его с замечательным эффектом. В высоком смысле можно сказать, что Джон Весли[43] с его помощью обратил добрую долю населения Англии в методизм. Он так живо описывал своим слушателям ад, что они лишились всяких надежд, растерялись и погрузились в пучину ужаснейшего отчаяния. Он же, в конце концов доведя их своим ораторским искусством до подобного состояния, провозгласил затем, что единственный путь избавления от отчаяния и греховности – вера в Иисуса. И они поверили и возрадовались.
Павлов познакомился с основами современного «промывания мозгов» во время несчастного случая. В городе началось наводнение. В подвале лаборатории находилась комната, где содержались две собаки, которых он терпеливо обучал разнообразным реакциям, чрезвычайно ценные для его исследований. Служитель позабыл перевести их в безопасное место.
Вода медленно заливала лабораторию, поднимаясь все выше и выше, пока собакам не пришлось плавать. Ограждение клеток доходило до потолка. По мере подъема воды собаки в паническом ужасе поднимались все ближе к потолку, пытаясь сохранить жизнь. Пространство над ними медленно сокращалось. Потом кто-то вспомнил про них, заплыл под водой в комнату и по очереди спас животных.
Оправившись от шока, ни одна из них не помнила ничего из выученного прежде – у них были начисто «промыты мозги». Каким же должно было быть переживание, если оно привело к таким результатам!
Спасшиеся из горящего дома в сильном испуге собаки бегут прочь со всех ног, не слыша команд, на которые прежде всегда реагировали. И это не обязательно объясняется страхом – вполне возможно, что пережитое «промыло им мозги».
С помощью этого неоднократно использовавшегося в психологических исследованиях метода можно добиться как полного, так и частичного «промывания».
Обратимся к частичному «промыванию», а именно к угасанию условного рефлекса в результате долговременного отсутствия стимула. Я рассказывал про Ред Трейлера, который через шесть месяцев разлуки после продажи не узнавал меня ни по внешнему виду, ни по голосу. Зрительная и слуховая память у него почти стерлись, но память о запахе сохранилась.
Точно так же можно пресекать и дурные привычки – для избавления от нежелательного условного рефлекса собаке не требуется полного «промывания мозгов». Можно прибегнуть к негативному подкреплению с помощью наказания, а можно позволить привычке угаснуть, удалив стимул. Если собака научилась лаять всякий раз, когда видит лошадь, следует позаботиться, чтобы она долго не видела ее, тогда при следующей встрече лошадь не вызовет у нее подобной реакции. Она может залаять, но уже не так яростно.
Для практического «промывания мозгов» необходимо следить, чтобы собака не получала удовлетворения от своих поступков. Психолог сказал бы: если стимул периодически не получает подкрепления, реакция угасает. Устойчивость результата зависит от того, насколько силен был условный рефлекс. Угасшие рефлексы восстанавливаются, и их приходится исключать снова и снова. «Наказание» – негативное подкрепление – может стать вторичным условным рефлексом. Если лающая собака, получавшая подкрепление, когда ей для успокоения часто давали еду, будет всякий раз, лая, получать наказание вместо пищи, у нее сформируется вторичный условный рефлекс. Она перестанет лаять, выпрашивая еду, но вскоре снова вернется к этой привычке.
С помощью негативных условных рефлексов можно быстрее всего отучить от дурных привычек, но при «промывании мозгов» такие рефлексы не возникают. Здесь речь идет лишь о результатах процесса угасания.
Негативное подкрепление – это стимул, который ослабляет последующую реакцию.
Под влиянием сильного негативного подкрепления – удара хлыста, шока, опрокинутого на собаку ведра воды – частота проявления нежелательного поступка сокращается. Чем сильней наказание, тем больше оно отражается на частоте. Заметьте, что я говорю именно о частоте, – собака будет гораздо реже совершать проступки.
Эффект наказания – негативного подкрепления – улетучится, если собака, попадая в прежнюю ситуацию, не будет «наказана» за каждый проступок, в противном случае она вскоре начнет вести себя так же плохо, как раньше.
Эмоциональная реакция, которая ассоциируется с наказующими стимулами, подобна условному рефлексу. Приведем пример: собаку обливают водой, вода становится негативным стимулом, но, завидев ведро, она ассоциирует его с «наказанием». Или, скажем, собака привыкла прыгать передними лапами на людей. Вы запрещаете ей это делать, говоря «нельзя» или «лежать», и сильно наступаете на задние лапы в момент прыжка. Негативный стимул – это боль в лапах, но она ассоциирует боль со словесной командой «нельзя» или «лежать». Через какое-то время достаточно произнести эти слова, не причиняя боли, и привычка исчезнет.
Один из лучших известных мне примеров состоит в том, что достаточно лишь наклониться и коснуться земли, чтобы заставить многих собак прекратить лай и броситься прочь в поисках убежища. Судя по этому факту, во многих собак что-то бросали – снежок, камень, горсть земли. В северных питомниках хозяева нередко заставляют лающих собак молчать, бросая в них снежки и одновременно говоря: «Тихо!» Собака очень быстро приобретает условный рефлекс, видя наклоняющегося хозяина и слыша команду «Тихо!». А сохраняется этот простой условный рефлекс очень долго.
Другой пример – собака лает, сидя на привязи в конуре, но молчит, когда ее переводят на ночь в гараж. Безусловно, она никогда не залает в гараже по следующей причине: хозяин опасается, как бы соседи чего не сказали, увидев, как он наказывает собаку на улице, поэтому заводит ее в гараж, где их никто не видит, и в случае лая прибегает там к негативному подкреплению – «наказанию». Предположим, собака лает на улице оттого, что осталась одна и нуждается в общении. Почему же она молчит, привязанная в такой же конуре внутри гаража? Просто потому, что ассоциирует гараж с «наказанием», и пребывание там само по себе превращается в стимул. Но когда нарушение не подкрепляется наказанием, страх со временем угасает.
Негативные стимулы действительно представляют собой наказание, сознаем мы это или нет. Над проблемой угасания и связи этого процесса с подкреплением проделана большая исследовательская работа. Вот один из наиболее памятных и не подвергшихся исследованию фактов: гораздо труднее исключить дурную привычку, при формировании которой подкрепление применялось редко, с перерывами или нерегулярно, чем изначально возникшую под воздействием методичного и регулярного подкрепления. Но, в последнем случае, связанное с пресечением привычки эмоциональное потрясение гораздо сильнее.
Для иллюстрации снова вернемся к собаке, привязанной в конуре на заднем дворе. Она лает. На первых порах хозяйка, чтобы успокоить ее, торопится принести из дому еду, никогда не позволяя собаке долго лаять из опасения рассердить соседей.
А другая собака живет на ферме. Она тоже лает, но соседей поблизости нет, так что с помощью лая еду можно выпросить лишь от случая к случаю, не регулярно.
Обе собаки проданы одному и тому же владельцу, которому придется теперь отучать их от лая. Он привязывает их в отдельных конурах и решает прибегнуть к водным процедурам. Ставит перед каждой будкой ведро воды. Как только собака залает, выбегает и выплескивает на нее ведро. Какая собака скорее отучится, у какой быстрее угаснет условный рефлекс или реакция сотрется в памяти?
Труднее будет справиться с собакой, которая получала награду время от времени, и легче с той, которую поощряли всякий раз без исключений, но последняя сильнее пострадает от эмоционального шока.
Представляется бесспорным, что сочетание позитивного и негативного подкрепления значительно эффективнее, чем применение каждого из них в отдельности. Тут встает вопрос: следует ли с самого начала дрессировки применять оба типа или лучше начать с позитивного, а потом прибегать к негативному? Очевидно, сначала необходимо дать собаке понять, что подобающее поведение поможет ей удовлетворять свои потребности. Нельзя начинать с «наказаний». Исследования, проведенные на нескольких видах животных, показали, что наиболее эффективный способ – отложить негативное подкрепление до тех пор, пока собака не станет правильно вести себя на протяжении 75 процентов времени, и лишь после этого приступать к исправлению проступков с помощью негативного подкрепления.
Предположим, вы желаете натаскать своего бигля только на кроличий след. Если при первых попытках он возьмет лисий след и вы его накажете за ошибочный выбор, можно навсегда отбить у собаки охоту идти по любому следу. Поэтому лучше снять его с лисьего следа, даже, может быть, пустить в заросли, выгнать кролика и дать погоняться за ним вволю. А если вам повезет подстрелить кролика, чтобы собака могла его потрепать, тем лучше. Наказывая собаку за гон по лисьему следу после того, как она хорошо научилась гонять кроликов, вы не позволите ей связать наказание с работой по кролику.
Следующий очень интересный феномен Павлов называл «обобщением».
Если у собаки в ответ на определенный стимул возникает условный рефлекс, она начнет реагировать также на другие, близкие к первому стимулы, но реакция будет при этом менее выраженной.
Например: ваша собака обучается лаять на звонок в дверь. Если сменить звонок и он будет звучать по-другому, она все равно прореагирует, только слабее.
Обучаясь лаять на дверной звонок, собака может залаять на любые звонки – кухонный таймер, телефон, будильник и прочее. Обнаружив со временем, что лай на любой звонок, кроме дверного, не вызывает у вас ответной реакции, она постепенно прекратит лаять на все прочие, за исключением звонка в дверь.
Здесь мы сталкиваемся с явлением различения. Чем сильнее стимул, тем скорее собака обучается процессу различения. Я рассказывал о поведении собак, привыкших к морфину, и о том, как они различали меня среди небольшой группы людей. Они испытывали очень сильную потребность в стимуле. И обладали на редкость острой для собак способностью к различению.
Когда собака в лаборатории слышит звук определенного тона, у нее формируется условный рефлекс слюнотечения. Услышав близкий к знакомому тон, она тоже будет пускать слюну, но слабее. Если потом она станет получать еду лишь при звуке одного тона, никогда не получая при близком, вскоре слюнотечение начнет возникать только при звуке нужного тона. Собака научилась различать. И всем известно, что они учатся этому весьма успешно.
Желая продемонстрировать, что бывает, когда от собак чересчур много требуют, часто ссылаются на знаменитые опыты Павлова, учившего их отличать круг от эллипса. Павлов все больше и больше приближал форму эллипса к кругу, пока собаки не утрачивали способность их различать, после чего у животных развивался невроз. Впрочем, едва ли кому-то захочется в процессе практической дрессировки превращать собак в невротиков.
Каждой собаке придется усвоить тысячи различий, прежде чем получить право считаться хорошо обученной. Возможно, именно этим определяется разница в интеллекте между псом, свободно бегающим на ферме, и собакой, которую держат в питомнике, если проэкзаменовать их в одном возрасте, скажем двухлетнем. По сравнению с собакой из питомника пес с фермы знает гораздо больше, так как ему приходилось усваивать гораздо больше различий. Отсюда мы видим, что различение связано с отказом от некоторых обобщений.
Повторим кое-что и проясним суть вопроса – мы обсудили условные и безусловные рефлексы и увидели, что означает угасание и различение. Все это виды научения. Пусть даже на первый взгляд больше кажется, будто собака разучивается, утрачивая приобретенное, однако процесс угасания необходим для различения, которому принадлежит жизненно важная для обучения роль.
Выявление отличий, или дифференциация, – это не то же самое, что различение, но эти свойства друг другу сопутствуют. Фоксхаунд, бегущий по лисьему следу, придерживается одного запаха и не сворачивает, даже если след пересекла другая лиса, оставившая более свежий запах. Это реакция различения. Но когда фоксхаунд впервые выходит в поле, сколько других видов животных искушают его пуститься в преследование – кролики, опоссумы, куропатки, фазаны, еноты, олени, лесные сурки, белки. Ему предстоит научиться отличать один вид от другого.
Собака фактически различает запах лисы потому, что порой след бывает влажным или, как говорят охотники, «горячим», а иногда сухим («остывшим»). Иногда след пересекает вспаханное поле и исчезает, но собака способна учуять его на другой стороне поля. Чтобы идти по следу, который постоянно меняется, реакция различения у нее должна быть очень острой, а для того, чтобы не сворачивать с «остывшего» на «горячий», оставленный другой лисой, – еще острее.
Некоторых собак с очень сильными от природы влечениями очень трудно обучить дифференциации и еще труднее – реакции различения.
Принцип «цепной реакции»
Согласно этому принципу один ответ или реакция на стимул может послужить стимулом для следующего ответа или реакции. Собака усваивает, что должна принести свою алюминиевую миску в определенное место, и тогда хозяйка, которая отправляется на работу и кормит собаку после возвращения в половине шестого, наполнит ее едой. Как только собака завидит хозяйку, сразу несет миску. Таким образом, приход хозяйки становится стимулом, который вызывает реакцию (собака идет за миской), которая вызывает следующую реакцию (собака следит, как в миску накладывают еду), которая служит ей подкреплением. Но вскоре собака усваивает, что звук поворачивающегося в замке ключа означает появление хозяйки. Этот стимул (если хотите, подсказка) заставляет собаку встречать хозяйку, приход хозяйки заставляет ее нести миску и так далее. Это простая цепная реакция.
Жизнь собак полна цепных реакций. Когда пес по кличке Ник Картер – величайшая из всех когда-либо живших в Америке ищеек по человеческому следу – чуял, что хозяин отстегивает карабин поводка от надетого на нем ошейника, он знал, что это сигнал приготовиться к поиску. И загорался жаждой деятельности. Чувствуя, что давление на горло слабеет, когда хозяин позволяет ему опустить голову, он получал другой стимул к поиску. Ощущение знакомого запаха от поискового снаряжения служило следующим стимулом. Но и это далеко не все.
Еще до того момента, с которого мы начали, в цепочке было множество стимулов. Во-первых, пес слышал междугородный телефонный звонок. В 1900 году междугородные звонки были длинными и продолжительными, в отличие от коротких местных. Ник научился их различать, и длинный звонок стал для него первым стимулом. Он бежал к вешалке, где висело его снаряжение, снимал с крючка и нес хозяину. Пока хозяин надевал и застегивал шлейку, последующие стимулы подкрепляли первый. Усвоив, что нельзя прыгать в стоявший во дворе автомобиль, не надев снаряжения, он получил стимул для следующей реакции. Все это, в свою очередь, означало поездку, которая служила следующим стимулом, и так далее. Любовь к поиску, страсть, которой позволено было обрести удовлетворение, отзывалась на стимулы. Со временем Ник находил преследуемого, иногда получал подкрепление в виде лакомства, что тоже составляло звенья цепочки реакций и стимулов. Кроме того, это хорошая иллюстрация принципа вторичного подкрепления.
Дата добавления: 2015-05-21; просмотров: 588;