Век самопознания (Кандел Эрик)

Сложная природа взаимодействий организма и среды требует особых механизмов, позволяющих не только распознавать стимулы, которые могут служить наградой или наказанием, но и на основании опыта спрогнозировать их появление в будущем. Многое из того, что нам известно о положительном подкреплении, открыл еще в начале XX века Иван Павлов (гл. 18 ).

Исследования дофаминергической системы показали, что она реагирует не только на саму награду, но и (даже сильнее) на стимулы, позволяющие ее ожидать. Многие годы психологи полагали, что для выработки условного рефлекса требуется одновременное (или почти одновременное) предъявление нейтрального условного стимула (сенсорного) и безусловного стимула (награды), позволяющее сформироваться ассоциации между теми и другими ощущениями. Согласно этим представлениям, всякий раз, когда стимулы предъявляются вместе, нейронная связь между ними усиливается до тех пор, пока не становится достаточно сильной, чтобы сказаться на поведении. Предполагалось, что сила условного рефлекса зависит исключительно от числа таких предъявлений.

Однако в 1969 году американский психолог Леон Кэмин совершил открытие, которое считается одним из важнейших, сделанных в этой области после Павлова. Кэмин установил, что животные научаются не просто тому, что нейтральный стимул предшествует награде, а тому, что он позволяет ожидать награды. Следовательно, ассоциативное научение определяется не критическим числом предъявлений двух стимулов вместе, а возможностью прогнозировать по нейтральному стимулу получение биологически значимой награды.

Эти открытия позволяют предположить, отчего у людей и животных так легко вырабатываются условные рефлексы. По-видимому, все формы ассоциативного научения развились в ходе эволюции потому, что давали возможность отличать закономерно связанные события от случайно сочетающихся, тем самым позволив нам прогнозировать последствия. В итоге мы можем научиться, например, ожиданию вкуса изысканного красного вина уже тогда, когда подносим к губам бокал “Шатонеф-дю-Пап” и улавливаем аромат.

Научение происходит тогда, когда реальные последствия отличаются от прогнозируемых. Существует множество форм поведения, на которые влияет ожидание награды. Когда награда оказывается не такой, как ожидалось, эти формы поведения претерпевают долговременные изменения. Когда же награда соответствует ожиданиям, поведение остается прежним.

— 259 —