Б. Ф. Скиннер. Оперантное поведение. Закон приобретения Поощрение с фиксированной частотой и с фиксированным интервалом.
Эдвард Чейс Толмен (1886-1959)
Система Толмена - целенаправленный бихевиоризм, сочетающий в себе объективное исследование поведения с учетом целенаправленности или ориентации на достижение определенной цели.
Один из ранних последователей бихевиоризма, Эдвард Толмен изучал инженерное дело в Массачусетском технологическом институте. Он переключился на психологию и под руководством Эдвина Холта начал работать в Гарварде, где получил звание доктора философии в 1915 году. Летом 1912 года Толмен учился в Германии вместе со специалистом по гештальт-психологии Куртом Коффкой. На последнем курсе аспирантуры, изучая традиционную, в духе Титченера, структурную психологию, Толмен познакомился с бихевиоризмом Уотсона. Будучи уже аспирантом, Толмен подвергал сомнению научную полезность интроспекции. В своей автобиографии, написанной в 1952 году, он писал, что бихевиоризм Уотсона стал для него «мощным стимулом и опорой».
Основные положения учения Толмена представлены в его работе «Целенаправленное поведение у животных и человека» (1932). Его система целенаправленнго бихевиоризма может на первый взгляд показаться любопытной смесью двух противоречащих друг другу понятий: цель и поведение. Приписывание некоей цели организму подразумевает привлечение понятия сознания — то есть менталистической концепции, которой не находится места в психологии поведения. Тем не менее Толмен совершенно определенно дал понять, что по своей методологии и по предмету исследования он остается последовательным бихевиористом. Он не побуждал психологов принять концепцию сознания. Подобно Уотсону, он отвергал интроспекцию и не интересовался никакими подразумеваемыми внутренними переживаниями организмов, которые были недоступны для объективного наблюдения.
Целенаправленность поведения, писал Толмен, можно определить в терминах объективного бихевиоризма, без ссылок на интроспекцию или предположений о том, что организм «чувствует» в связи с тем или иным переживанием. Для него было совершенно очевидно, что любое поведение направлено на достижение определенной цели. Например, кошка старается выбраться из «проблемного ящика», крыса осваивается в лабиринте, а ребенок учится играть на фортепиано.
Как говорил сам Толмен, поведение «пахнет целью». Любое поведение направлено на достижение некоторой цели, на освоение некоторых средств. Крыса неоднократно и настойчиво проходит лабиринт, всякий раз делая все меньше ошибок, чтобы быстрее добраться до выхода. Иначе говоря, крыса учится, и сам факт обучения — для крысы или для человека — является объективным поведенческим свидетельством наличия цели. Толмен имеет дело только с реакциями организмов. Все его измерения проводились в терминах изменений в ответном поведении, как функции научения. И эти измерения предоставляют объективную информацию.
Бихевиоризм Уотсона с большой легкостью подвергал критике приписывание какой-либо цели любому виду поведения, поскольку целенаправленность поведения подразумевает допущение о наличии сознания. Толмен отвечал на это, что для него нет разницы, обладает организм сознанием или не обладает. Переживания сознания, связанные с целенаправленным поведением, если они даже и имеют место, не оказывают никакого влияния на поведенческие реакции организма. Толмен занимался исключительно явно выраженными реакциями.
Как бихевиорист, Толмен считал, что инициирующее причинное поведение и окончательное результирующее поведение должны быть объективно наблюдаемыми и пригодными для описания в терминах операций. Он предположил, что причины поведения включают пять основных независимых переменных: стимулы окружающей среды, психологические побуждения, наследственность, предшествующее обучение и возраст. Поведение является функцией всех этих переменных, что выражается математическим уравнением.
Между этими наблюдаемыми независимыми переменными и результирующим ответным поведением (зависимой наблюдаемой переменной) Толмен ввел набор ненаблюдаемых факторов, которые назвал промежуточными переменными. Эти промежуточные переменные фактически являются детерминантой поведения. Они представляют собой те внутренние процессы, которые связывают стимулирующую ситуацию с наблюдаемой реакцией. Формула бихевиоризма S—R (стимул—реакция) теперь должна читаться как S—О—R. Промежуточными переменными является все, что связано с О, то есть с организмом, и формирует данную поведенческую реакцию на данное раздражение.
Поскольку эти промежуточные переменные не подлежат объективному наблюдению, то они не представляют никакой практической пользы для психологии, если только их не удается связать с экспериментальными (независимыми) переменными и с поведенческими (зависимыми) переменными.
Классическим примером промежуточной переменной является голод, который невозможно увидеть у подопытного человека или животного. И тем не менее, голод можно вполне объективно и точно увязать с экспериментальными переменными — например, с длительностью того отрезка времени, на протяжении которого организм не получал пищу. Кроме того, его можно увязать и с объективной реакцией или с переменной поведения — например, с количеством съеденной пищи или со скоростью ее поглощения. Таким образом, ненаблюдаемый фактор вмешательства — голод — может получить точную эмпирическую оценку и следовательно становится доступным для количественного измерения и экспериментальных манипуляций.
Путем определения независимых и зависимых переменных, каковыми являются наблюдаемые события, Толмен получил возможность составить операциональные описания ненаблюдаемых, внутренних состояний. Сначала он называл свой подход «оперантным бихевиоризмом», прежде чем выбрать термин «промежуточные переменные».
Промежуточные переменные — ненаблюдаемые и предполагаемые факторы организма, фактически являющиеся детерминантой поведения.
Промежуточные переменные оказались весьма полезными для разработки теории поведения, постольку они были эмпирически связаны с экспериментальными и поведенческими переменными. Однако для того, чтобы сделать этот подход всеобъемлющим, потребовался такой громадный объем работы, что Толмен в конце концов оставил всякую надежду «составить полное описание хотя бы одной промежуточной переменной»
Теория научения. Научение играло важнейшую роль в целенаправленном бихевиоризме Толмена. Он отвергал закон эффекта Торндайка, утверждая, что вознаграждение или поощрение оказывает слабое воздействие на научение. Взамен этого Толмен предложил когнитивную теорию научения, предполагая, что повторяющееся выполнение одного и того же задания усиливает создаваемые связи между факторами окружающей среды и ожиданиями организма. Таким путем организм познает окружающий его мир. Толмен называл эти создаваемые научением связи гештальт-знакам и, которые вырабатываются в ходе многократного выполнения какого-либо действия.
Крыса бегает по лабиринту, исследуя иногда правильные, а иногда неправильные ходы или даже тупики. Наконец крыса находит еду. При последующих прохождениях лабиринта цель (поиск пищи) придает поведению крысы целенаправленность. С каждой точкой разветвления связываются некоторые ожидания. Крыса приходит к пониманию того, что определенные признаки, ассоциирующиеся с точкой разветвления, наводят или не наводят на то место, где находится пища.
Если ожидания крысы оправдываются и она действительно находит пищу, то знак гештальта (то есть признак, ассоциирующийся с некоторой точкой выбора) получает подкрепление. Таким образом животное вырабатывает целую сеть гештальт-знаков по всем точкам выбора в лабиринте. Толмен назвал это когнитивной картой. Эта схема представляет собой то, что выучило животное: а именно когнитивную карту лабиринта, а вовсе не набор некоторых моторных навыков. В некотором смысле крыса обретает всеобъемлющее знание своего лабиринта или иной окружающей ее среды. В ее мозге вырабатывается что-то вроде полевой карты, которая позволяет ей перемещаться от точки к точке, не ограничиваясь фиксированным набором заученных телодвижений:
Был использован лабиринт крестообразной формы. Крысы одной группы всегда находили пищу на одном и том же месте, даже если для того, чтобы добраться до пищи, им при разных точках входа приходилось иногда поворачивать не направо, а налево. Моторные реакции отличались, но пища оставалась на том же самом месте.
Крысы второй группы должны были всегда повторять одни и те же движения, но пища всякий раз находилась в другом месте. Например, начиная путь с одного конца крестообразного лабиринта, крысы находили пищу, только повернув в точке выбора направо; если же крысы входили в лабиринт с противоположной стороны, то для того, чтобы найти пищу, им все равно надо было повернуть направо.
Результаты эксперимента показали, что крысы из первой группы, то есть те, которые изучили место действия, ориентировались гораздо лучше, чем крысы из второй группы, которые заучивали реакции. Толмен пришел к выводу, что аналогичное явление наблюдается и у тех людей, которые хорошо знают свои окрестности или город. Они могут пройти из одной точки в другую различными маршрутами, поскольку в их мозге сформирована когнитивная карта местности.
Другой эксперимент исследовал латентное научение — то есть такое научение, которое невозможно наблюдать в то время, когда оно фактически происходит. Голодную крысу поместили в лабиринт и предоставили ей возможность свободно бродить по нему. Сначала в лабиринте не было никакой пищи. Сможет ли крыса обучиться чему-либо при отсутствии подкрепления? После нескольких неподкрепленных попыток крысе дали возможность найти пищу. После этого скорость прохождения крысой лабиринта резко возросла, что показало наличие некоторого научения в период отсутствия подкрепления. Показатели этой крысы очень быстро достигли такого же уровня, что и у крыс, получавших подкрепление при каждой попытке.
Латентное научение — научение, которое не поддается наблюдению в то время, когда оно происходит.
Б. Ф. Скиннер (1904-1990)
Самой влиятельной фигурой в психологии в течение нескольких десятилетий являлся Б. Ф. Скиннер. Скиннер успешно закончил колледж со степенью по английскому языку, правом принадлежности к обществу «Фи Бета Каппа» и стремлением стать писателем. Прочитав об экспериментах Уотсона и Павлова по формированию условных рефлексов, Скиннер круто повернулся от литературных аспектов человеческого поведения к научным. В 1928 году он поступил в аспирантуру Гарвардского университета по психологии — несмотря на то, что до этого ни разу не прослушал курса психологии. Через три года он получил ученую степень доктора философии. По завершении научной работы, после защиты докторской диссертации, он преподавал в университете штата Миннесота (1936—1945) и университете штата Индиана (1945—1974), после чего вернулся в Гарвард.
Тема его диссертации относится к положению, которому Скиннер неуклонно следовал в течение всей своей карьеры. Он предположил, что рефлекс представляет собой корреляцию между стимулом и реакцией, и ничего более. В его книге 1938 года «Поведение организмов» описываются основные положения этой системы.
Оперантное поведение возникает без воздействия каких-либо внешних наблюдаемых раздражителей. Реакция организма кажется спонтанной в том смысле, что внешне она никак не связана с каким-либо наблюдаемым раздражителем.
Классическая экспериментальная демонстрация заключалась в нажатии на рычаг в скиннеровском ящике. В этом эксперименте крыса, лишенная пищи, помещалась в ящик и получала полную возможность исследовать его. В ходе исследований она неизбежно должна была задеть рычажок, который приводил в действие механизм, выдвигающий полочку с пищей. После получения нескольких порций пищи, которые должны были служить подкреплением, у крысы довольно быстро формировался условный рефлекс. Обратите внимание, что поведение крысы (нажатие на рычаг) оказывает воздействие на окружающую среду и является инструментом приобретения пищи. Зависимая переменная в этом эксперименте проста и понятна: это скорость реакции.
Различием между респондентным и оперантным поведением является то, что оперантное поведение воздействует на окружающую организм среду, в то время как респондентное поведение этого не делает. Подопытная собака в лаборатории Павлова, закованная в сбрую, не может сделать ничего иного, как только реагировать (например, пускать слюну), когда экспериментатор предлагает ей какие-либо стимулы. Собака сама по себе ничего не может сделать, чтобы достать стимул (пищу).
Оперантное поведение крысы в коробке Скиннера, напротив, является инструментальным в том смысле, что крыса достигает своего стимула (пищи). Когда крыса нажимает на рычаг, она получает пищу; а если не нажимает на рычаг, то не получает пищи. Таким образом крыса воздействует на окружающую среду.
Скиннер считал, что оперантное поведение характерно для повседневного научения. Поскольку поведение, как правило, носит оперантный характер, то наиболее эффективным подходом к науке о поведении является изучение обусловливания и угасания оперантного поведения.
На основании этого эксперимента Скиннер сформулировал свой закон приобретения, который гласит, что сила оперантного поведения возрастает, если поведение сопровождается подкрепляющим стимулом. Несмотря на то, что для формирования быстрой реакции нажатия на рычажок требуется практика, ключевым параметром все-таки является подкрепление. Практика сама по себе ничего не дает: она только предоставляет возможность возникновения дополнительного подкрепления.
Закон приобретения Скиннера отличается от положений о научении у Торндайка и у Халла. Скиннер вообще не касался таких последствий подкрепления, как боль—приятное ощущение или удовольствие-неудовлетворение, как это делал Торндайк. Скиннер так же не пытался интерпретировать подкрепление в терминах снижения воздействия
В «скиннеровском ящике» поведение крысы при каждом нажатии на рычаг получало подкрепление. То есть всякий раз, выполнив правильное действие, крыса получала пищу. Скиннер отмечал, что хотя в реальной жизни подкрепление далеко не всегда бывает последовательным или непрерывным, тем не менее, научение все-таки происходит и поведение сохраняется, даже если подкрепление было случайным или редким.
Как-то раз в субботу вечером Скиннер обнаружил, что у него почти закончился запас корма. В то время (тридцатые годы) еще нельзя было купить корм у специальных компаний по снабжению исследовательских лабораторий; экспериментатор должен был делать шарики вручную, что являлось достаточно длительным и трудоемким процессом.
Вместо того, чтобы потратить свои выходные на изготовление кормовых шариков, Скиннер задал себе вопрос: что произойдет, если он будет давать подкрепление своим крысам один раз в минуту, независимо от того, какое будет количество ответных реакций? При таком подходе ему потребуется намного меньше корма, и на выходные дни должно хватить. Скиннер решил провести длительную серию экспериментов, чтобы проверить различные варианты системы подкреплений.
В одном таком исследовании Скиннер сравнил частоту реакции у животных, которые получали подкрепление при каждой реакции, с частотой реакций тех животных, которые получали подкрепление только по истечении некоторого интервала времени. Последнее условие получило название схемы подкрепления с фиксированным интервалом. Подкрепление могло выдаваться, например, один раз в минуту или каждые четыре минуты. Важным моментом в данном случае является то, что подопытное животное получало подкрепление только по истечении определенного отрезка времени. Исследование Скиннера показало, что чем короче интервал между подкреплениями, тем чаще животное проявляет обусловленную реакцию. И наоборот, по мере того, как увеличивается интервал между подкреплениями, частота реакции снижается.
Частота подкрепления также оказывает влияние на угасание условной реакции. Проявление условной реакции угасает с большей скоростью, если имело место непрерывное подкрепление, которое затем резко было прекращено, чем в том случае, когда подкрепление выдавалось с перерывами. Некоторые голуби демонстрировали до десяти тысяч реакций без подкрепления, если исходно у них был сформирован условный рефлекс на основе периодичного, прерывистого подкрепления.
Скиннер исследовал также схему подкрепления с фиксированной частотой. В этом случае подкрепление выдается не по истечении определенного отрезка времени, а после выполнения определенного количества условных реакций. Само поведение животного определяет, насколько часто будет выдаваться подкрепление. Например, требуется совершить десять или двадцать обусловленных ответных реакций, чтобы получить новое подкрепление. Животные, получающие поощрение по схеме с фиксированной частотой, реагируют намного интенсивнее, чем те, которые получают подкрепление по схеме с фиксированным интервалом. Ведь очевидно, что высокая частота реагирования при схеме с фиксированным интервалом не приводит к получению дополнительного подкрепления; животное может нажать на рычаг пять раз или пятьдесят, но подкрепление появится только тогда, когда истечет заданный отрезок времени.
Те звуки, которые человеческий организм производит в процессе речи, утверждал Скиннер, также являются формой поведения, а именно — вербальным поведением. Они представляют собой реакции, которые могут подкрепляться другими звуками речи или жестами точно так же, как нажатие крысой рычага подкрепляется получением пищи.
Для вербального поведения требуются два взаимодействующих человека —говорящий и слушающий. Говорящий определенным образом реагирует — это значит, что он произносит звук. Слушатель может управлять последующим поведением говорящего путем выражения подкрепления, отсутствия подкрепления или наказания — в зависимости от того, что было сказано.
Например, если всякий раз, как говорящий употребляет то или иное слово, слушатель улыбается, то он тем самым увеличивает вероятность того, что говорящий снова употребит это слово. Если слушатель реагирует на слово тем, что хмурит брови или отпускает язвительные замечания, то он тем самым увеличивает вероятность того, что говорящий в будущем будет избегать употребления этого слова.
Примеры такого процесса можно наблюдать в поведении родителей, когда их дети учатся говорить. Недопустимые слова или выражения, неправильное применение слов, плохое произношение вызывают реакцию, в корне отличающуюся от той, которой встречают вежливые
Вопросы:
Дата добавления: 2015-10-09; просмотров: 1922;