нец кошка становится способной правильно вести себя, как только ее поместят в
ящик.
Торндайк (1898) назвал научение такого типа «методом проб, ошибок и случайного
успеха». Теперь оно называется инструментальным научением, поскольку
правильная реакция, ведущая к вознаграждению, требует использования
«инструментов». Цирковые дрессировщики знали о научении такого типа в течение
столетий, но Торндайк первый исследовал его систематически и создал на основе
своих наблюдений стройную теорию.
Для объяснения изменений, происходящих в поведении животного в этих опытах,
Торндайк (1913) предложил свой «закон эффекта». Он гласит, что для реакции, за
которой следует вознаграждение или состояние удовлетворения, вероятность
повторения возрастает, а для реакции, вызывающей вредное или неприятное
последствие, вероятность повторения снижается. Таким образом, успех
инструментального научения приписывается тому факту, что выработанное
поведение может быть непосредственно изменено его последствиями. Торндайк
(1911) считал, что подкрепление повышает вероятность реакции, с которой оно
сочетается, потому что усиливает установленную связь между ней и
присутствующей стимульной ситуацией. Этот взгляд стал известен как «теория
научения по принципу стимул-реакция», и варианты этой теории господствовали в
течение многих лет. Признавая значение закона эффекта как эмпирического факта,
современные психологи в то же время сомневаются в том, что поведение
непосредственно модифицируется своими последствиями, как предполагали
Торндайк и его школа. Чтобы понять это, сначала надо рассмотреть природу
подкрепления.
17.6. Подкрепление
Между способом проведения опыта по выработке классического условного
рефлекса и постановкой эксперимента по инструментальному научению
существует коренное различие. В первом случае связь устанавливается между УС
(например, звонком) и БС (например, пищей). Подкрепление предъявляется
независимо от поведения животного. При инструментальном научении
подкрепление (например, пища) связано с определенным поведением животного
(например, с нажимом на рычаг). Таким образом, при классических условных
рефлексах связь устанавливается между стимулом и результатом, а при
инструментальном научении она возникает между реакцией и результатом. Такие
различия необязательно означают, что в этих двух типах опытов происходят разные
виды научения, но они говорят о разных процессах подкрепления.
Как мы видели, согласно взгляду Павлова, наличие подкрепляющего стимула в
определенных условиях приведет к тому, что реакции, вызываемые им, будут
возникать еще до подкрепления. Ясно, однако, что не всегда подкрепление
необходимо для проявления выработанных связей между стимулами. Это яснее
всего видно при рассмотрении феномена, называемого сенсорным
предобусловливанием. При нем два условных стимула (УC
1
и УС
2
) применяются
вместе много раз до того, как в опыт вводится БС. За совместным предъявлением
УC
1
и УС
2
следует сочетание УC
1
с БС. В заключительной части опыта измеряется
сила УР в ответ на УС
2
.
Первая четкая демонстрация сенсорного предобусловливания принадлежит
Брогдену (Brogden, 1939), который предъявлял собакам 200 одновременных
сочетаний света и зуммера. Затем один из этих стимулов сочетался с
электрическим ударом лапы для выработки ее условнорефлекторного сгибания.
Применения второго УС вызывали в среднем 9,4 УР по сравнению со всего лишь
0,5 УР в контрольных опытах без предварительного сочетания зуммера и света.
Более поздние опыты показывают, что лучшие результаты получаются при
меньшем числе предварительных сочетаний и когда два УС предъявляются не
одновременно, а с промежутком в несколько секунд (Mackintosh, 1974).
Результаты опытов с сенсорным предобусловливанием ясно показывают, что
290