10.4. Обучение
10.4. Обучение
Можно сказать, что происходит обучение, когда имеется какое-либо относительно постоянное адаптивное изменение в поведении в результате прошлого опыта. Здесь можно выделить четыре общие категории:[215]
(1) Наиболее универсальным типом, который обнаруживается даже у одноклеточных организмов,[216] является привыкание, которое можно определить как ослабление реакции в результате повторения стимула, не сопровождающегося каким-либо подкреплением его значимости. Известный пример такого рода — исчезновение реакций тревоги или избегания на новые стимулы, которые оказываются безвредными: животные к ним привыкают.
Этот феномен предполагает существование своего рода памяти, позволяющей узнавать стимулы, когда они повторяются. По гипотезе формативной причинности это узнавание обусловлено главным образом морфическим резонансом организма с его собственными прошлыми состояниями, включая те, которые были вызваны новыми сенсорными стимулами. Этот резонанс служит для поддержания и фактически для определения идентичности организма с самим собой в прошлом (раздел 6.5). Повторяющиеся стимулы от окружения, отклики на которые не подкрепляются, станут действующей частью собственного «фона» организма. Наоборот, любые новые особенности окружения будут выделяться, поскольку они не распознаются как «свои»: обычно реакцией животного будет тревога или избегание именно потому, что стимулы ему незнакомы.
В случае некоторых стереотипных ответов, — таких как рефлекс отдергивания рожек у улитки Aplysia, привыкание может происходить квазимеханистическим образом на основе предсуществующих структурной и биохимической специализаций в нервной системе (раздел 10.1). Но если так, эта специализация является вторичной и возникает, вероятно, в результате ситуации, в которой привыкание более непосредственно зависит от морфического резонанса.
(2) У всех животных врожденные модели двигательной активности выявляются по мере того, как индивид взрослеет. В то время как одни прекрасно действуют в первый же раз, когда они выполняются, другие совершенствуются со временем. Например, первые попытки птенца взлететь или детеныша млекопитающего — ходить могут быть успешными лишь отчасти, но они улучшаются после повторных усилий. Не все такие улучшения обусловлены практикой: в некоторых случаях это просто результат созревания и происходит в такой же степени с течением времени у животных, которые были иммобилизованы.[217] Тем не менее многие виды двигательных приемов улучшаются таким способом, который нельзя приписать созреванию.
С точки зрения гипотезы формативной причинности этот тип обучения можно интерпретировать как регуляцию поведения. Морфический резонанс от бесчисленных прошлых особей данного вида автоматически дает усредненную хреоду, которая руководит первыми попытками животного осуществить определенную врожденную модель движения. Эта стандартная хреода может дать лишь приблизительно удовлетворительные результаты, например из-за отклонений от нормы органов чувств у животного, или его нервной системы, или двигательных структур. По мере того как движения совершаются, регуляция самопроизвольно вызывает к жизни «тонкие подстройки» к общей хреоде, а также к хреодам низшего уровня, которые она контролирует. Эти «подстроенные» хреоды будут стабилизироваться путем морфического резонанса с прошлыми состояниями самого животного, по мере того как будет повторяться эта модель поведения.
(3) Животные могут начать отвечать на какой-либо стимул реакцией, которая в норме вызывается другим стимулом. Такой тип обучения имеет место тогда, когда новый стимул действует одновременно или сразу же после начального стимула. Классическими примерами являются условные рефлексы, установленные И. П. Павловым на собаках. Например, у собак выделяется слюна, когда им предлагают пищу. В повторяющихся экспериментах, когда предлагалась пища, звонил колокольчик, и через некоторое время при звуке колокольчика у них начинала выделяться слюна даже в отсутствие пищи.
Крайняя степень выражения обучения этого типа встречается в запечатлении (импринтинге) у птенцов, особенно у утят и гусят. Вскоре после вылупления из яиц они инстинктивно реагируют на любой достаточно большой движущийся объект, следуя за ним. В нормальных условиях это их мать, но они будут следовать также за приемными матерями, людьми или даже неодушевленными предметами, которые перед ними двигают. Через сравнительно короткое время они научаются распознавать общие черты движущегося объекта, а позднее и его особые черты. Тогда отклик в виде следования вызывается только определенной птицей, человеком или объектом, который был у них запечатлен.
Аналогичным образом животные часто научаются узнавать индивидуальные особенности своих партнеров или детенышей по виду, запаху или прикосновению. Для развития такого узнавания требуется время: например, пара птиц лысух с только что вылупившимися птенцами будет кормить и даже «усыновлять» чужих птенцов, внешне похожих на их собственных, но когда их детенышам исполняется две недели, родители узнают их по индивидуальным особенностям и уже далее не терпят никаких пришельцев, как бы они ни были похожи на их птенцов.[218]
Подобный же процесс, вероятно, является причиной узнавания определенных мест, таких как гнездовья, с помощью меток и других связанных с ними особенностей. По-видимому, такой тип обучения играет важную роль в развитии зрительного распознавания вообще. Поскольку стимулы от объекта различаются в зависимости от угла, под которым он наблюдается, животное должно понять, что все они связаны с одной и той же вещью. Подобно этому, ассоциации между различными видами чувственных стимулов от одного и того же объекта — зрительных, слуховых, обонятельных, вкусовых и тактильных — обычно должны быть установлены в процессе обучения.
Когда новый и первоначальный стимулы действуют одновременно, на первый взгляд может показаться вероятным, что различные наборы физико-химических изменений, вызываемых этими стимулами в мозгу, постепенно становятся взаимосвязанными вследствие частого повторения. Но такая, кажущаяся простой интерпретация сталкивается с двумя трудностями.
Во-первых, новый стимул может иметь место не одновременно с обычным, но предшествовать ему. В этом случае кажется необходимым предположить, что влияние стимула некоторое время сохраняется, так что оно еще присутствует, когда обычный стимул начинает действовать. О таком виде памяти можно думать по аналогии с эхом, которое постепенно затихает вдали. Существование такой краткосрочной памяти было продемонстрировано на опыте;[219] предположительно ее можно было объяснить действием резонансных (ревербераторных) цепей электрической активности мозга.[220]
Во-вторых, обучение включает, по-видимому, определенные разрывы, оно происходит по ступеням или стадиям. Это может объясняться тем, что связь между новым и начальным стимулами включает установление нового моторного поля: поле, ответственное за начальный отклик, должно быть каким-то образом увеличено, чтобы оно могло вместить новый стимул. В сущности, происходит синтез, в котором возникает новая моторная единица. А она не может появиться постепенно, но лишь в результате внезапного «квантового скачка» (или нескольких последовательных «скачков»).
(4) Наряду с обучением ответу на определенный стимул после его получения животные также могут научиться вести себя так, что они достигают цели в результате своих действий. На языке школы бихевиоризма в этой «обусловленности действием» (operant conditioning) ответ, «выдаваемый» животным, предшествует подкрепляющему стимулу. Классические примеры такого рода дают крысы в ящиках Скиннера. В этих ящиках имеется рычаг, который, если на него нажать, выдает съедобный шарик. После ряда попыток крыса уже может связывать нажатие рычага с наградой. Подобным же образом крысы научаются нажимать рычаг, чтобы избежать болезненной стимуляции электрошоком.
Ассоциация определенной модели движения с наградой или с избеганием наказания наступает обычно в результате проб и ошибок. Но у приматов, особенно у шимпанзе, было обнаружено существование разума в общем более высокого порядка. В некоторых хорошо известных экспериментах, проведенных более пяти— десяти лет назад, У. Кёлер выяснил, что эти приматы способны решать проблемы с помощью своей «проницательности».[221] Например, несколько шимпанзе помещали в высокую камеру с гладкими стенками, на которые нельзя было влезть, с потолка свисала гроздь спелых бананов, причем они были слишком высоко, чтобы их можно было достать. После нескольких попыток добыть этот фрукт, вставая на задние ноги и подпрыгивая, они отказывались от такого способа. Через некоторое время какая-либо из обезьян бросала взгляд вначале на один из множества деревянных ящиков, которые были положены в камеру в начале эксперимента, а потом на бананы. Затем эта обезьяна подтаскивала ящик под бананы и вставала на него. Это не позволяло подняться достаточно высоко, и тогда она приносила другой ящик, ставила его на первый, но и этого было недостаточно, тогда она добавляла третий, вскарабкивалась на него и срывала бананы.
Многие другие примеры такой сообразительности были продемонстрированы впоследствии другими экспериментаторами: например, в одном эксперименте шимпанзе научились использовать палки, чтобы подгребать к себе еду, помещенную за пределами клеток и вне их досягаемости. Они делали это быстрее, если им разрешалось играть с палками за несколько дней до эксперимента — в течение этого времени они учились использовать палки в качестве функциональных «удлинителей» своих рук. Так, применение палок для приближения к себе еды представляло «интеграцию двигательных компонент, приобретенных во время предшествующего опыта, в новые подходящие модели поведения».[222]
При обучении как типа «проб и ошибок», так и с помощью «улавливания отношений» (инсайта) существующие хреоды объединяются в одно целое (интегрируются) с новыми моторными полями высшего уровня. Такие синтезы могут происходить только путем внезапных «скачков». Если новые модели поведения оказываются успешными, они приобретают тенденцию к повторению. Следовательно, новые моторные поля будут стабилизированы морфическим резонансом, когда поведение, усвоенное в результате обучения, станет привычным.