Обучение с подкреплением — это вовсе не система наград и наказаний; современные тренеры даже не
используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено,
часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не
повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное
действие. Подкрепление — будь то «положительное», то, к чему надо стремиться, например улыбка или
ласка, или «отрицательное» — то, чего надо избегать, подобно рывку поводка или нахмуренным бровям, —
происходит именно во время поведения, на которое надо воздействовать. Подкрепление изменяет
поведение только тогда, когда дается в правильно выбранный момент.
Впервые я услышала об обучении с положительным подкреплением на Гавайях, куда в 1963 году я была
приглашена старшим тренером дельфинария «Жизнь моря». Раньше rfдрессировала собак и лошадей,
пользуясь традиционными методами, но дельфины — другое дело; на животное, которое просто уплывает
от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление — в
основном ведро с рыбой — единственное, чем мы располагаем. Психологи в общих чертах познакомили
меня с принципами обучения с подкреплением. Искусство применения этих принципов я постигла при
работе с дельфинами.
То, чему я обучилась, работая с дельфинами, я стала применять и в дрессировке других животных. И я
начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на
своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу
подкреплять его — это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье.
Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В
этой книге я постаралась держаться подальше от теоретизирования, так как, насколько мне известно,
правила по применению этих теорий обычно не описываются наукой и, с моей точки зрения, ученые часто
неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во
внимание при обучении.
Основа этой теории по разным источникам известна как модификация поведения, теория подкрепления,
оперантное обусловливание, бихевиоризм, психология поведения и т. д.; это тот раздел психологии,
который принес мировую известность Б. С. Скиннеру, профессору Гарвардского университета.
Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали,
переиначивали, неправильно истолковывали и неверно использовали. Одно только имя Скиннера приводит
в ярость тех, кто является поборником «свободной воли» в качестве характеристики, отделяющей человека
от животного. Для тех, кто воспитан в гуманистических традициях, воздействие на поведение человека при
помощи своего рода осознанной техники кажется непоправимо безнравственным, несмотря на тот
очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавшимися под руку
средствами.
Пока гуманисты нападали на бихевиоризм и самого Скиннера с таким же жаром, с каким когда-то
правоверные обрушивались на еретиков, бихевиоризм превратился в громадный раздал психологии,
которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы
издают специальные журналы и созывают международные конгрессы, бихевиоризму обучают на
специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящаются целые горы
литературы. Это принесло определенную пользу обществу. Некоторые болезни — например, аутизм —
оказались более чувствительны к формированию и подкреплению, чем к любым другим воздействиям.
Многие врачи успешно разрешали эмоциональные проблемы своих пациентов, используя приемы
бихевиоризма. Большая эффективность простого изменения поведения по сравнению со скрупулезным
копанием в источниках его происхождения — по крайней мере, в некоторых обстоятельствах,
способствовала возникновению семейной терапии, в которой рассматривается поведение, каждого члена
семьи, а не только того, чье страдание наиболее очевидно. Обучающие машины и программированные
учебники, разработанные на основе Скиннеровской теории, были первыми попытками разбить обучение на
этапы и поощрять обучающегося за правильные ответы. Эти ранние механизмы были неуклюжими, но
именно они были предвестниками компьютерного обучения, которое оказалось не только высокоэффектив-
ным, благодаря совершенству выбора времени подкрепления компьютером, но и внесло в процесс
обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы).
Программы подкрепления, использующие жетоны и талоны, которые можно накопить и обменять на
конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых
других учреждениях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и
изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении.
Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно
нападают, и наконец, она принимается как нечто само собой разумеющееся. Насколько мне известно,