Башня порождения и проверки[12]
Башня порождения и проверки[12]
Чтобы видеть дальше во времени, полезно смотреть дальше в пространстве. То, что в начале было внутренними и периферийными системами мониторинга, медленно эволюционировало в системы, способные осуществлять не только проксимальные (ближайшие), но и дистальные (удаленные) различения. Именно здесь вступает в свои права восприятие. Нюх, или обоняние, основывается на приносимых издалека (ветром) предвестниках, выполняющих роль ключей к местным замкам. Траектории, по которым относительно медленно движутся эти предвестники, изменчивы и неопределенны из-за случайных рассеиваний и испарений их запахов; следовательно, информация о распространяющем их источнике является ограниченной. Слух зависит от звуковых волн, попадающих на датчики системы, а поскольку эти волны более быстрые и стабильные, восприятие может продвинуться в своем приближении к «действию на расстоянии». Но звуковые волны могут преломляться и отражаться, скрывая тем самым свой источник. Зрение зависит от намного более быстрых фотонов, отражающихся от предметов в мире. И фотоны движутся по совершенно прямым траекториям, так что при обустройстве крошечного отверстия соответствующей формы (и необязательно содержащего линзу) организм может мгновенно получать информацию высокой степени точности о событиях и поверхностях вдали от него. Как произошел этот переход от внутренней к проксимальной, а затем к дистальной интенциональности? Для получения информации, поступающей на периферию тела, в ходе эволюции была создана масса специализированных внутренних агентов. В свете, падающем на сосну, закодировано столько же информации, как и в свете, падающем на белку, но белка снабжена миллионами микроагентов, специально предназначенных для приема и даже для поиска и интерпретации этой информации.
Животные являются не только травоядными или плотоядными. Они, по удачному выражению психолога Джорджа Миллера, также информоядны. Их эпистемический голод складывается, как некое совершенное объединение, из эпистемического голода миллионов отдельных микроагентов, организуемых в десятки, сотни или тысячи подсистем. Каждого из этих крошечных агентов можно считать абсолютно минимальной интенциональной системой, жизненная программа которой состоит в том, чтобы снова и снова задавать один-единственный вопрос: «Сообщение мне поступает СЕЙЧАС?», — и сразу же выполнить небольшое, но нужное действие в случае ответа «ДА». Без эпистемического голода нет ни восприятия, ни рассудка. Философы неоднократно пытались разложить восприятие на Данное и то, что делает с Данным сознание. Данное является, конечно, Взятым, но взятие Данного — это не нечто такое, что совершает один Главный Берущий, локализованный в неком центральном штабе в мозге животного. Задача взятия Данного распределена между всеми берущими с их индивидуальной организацией. Берущими являются не только периферийные датчики (палочки и колбочки в сетчатке глаза, специализированные клетки в эпителии носа), но и все внутренние функционеры, которых они снабжают «пищей», т.е. клетки и группы клеток, соединенные в сети по всему мозгу. Эта пища поступает к ним не в виде света или давления (давления звуковых волн и тактильного давления), а в виде нейронных импульсов; но если не считать этого изменения в пище, все они играют сходную роль. Каким образом эти агенты организовались в более крупные системы, способные обеспечивать еще более совершенные формы интенциональности? Конечно, в ходе эволюции путем естественного отбора, но не в виде единого процесса.
Я хочу предложить общую схему, в которую можно включить различные варианты конструкций для мозга, с тем чтобы понять, откуда проистекают его способности. Это крайне упрощенная структура, но идеализация является ценой, которую зачастую приходится платить за суммарное представление. Я называю эту структуру Башней порождения и проверки. При возведении каждого нового этажа Башни организмы получают возможность находить все лучшие и лучшие ходы и находить их все более эффективным способом.
Тогда растущую способность организмов созидать будущее можно представить в виде последовательности шагов. Почти наверняка, эти шаги не соответствуют четко определенным переходным периодам в эволюционной истории (без сомнения, у разных биологических родов они совмещались, и в их осуществлении не было единообразия), но различные этажи Башни порождения и проверки знаменуют важные успехи в развитии познавательной способности, и как только мы увидим в общих чертах несколько ключевых особенностей каждого этажа, остальные этапы эволюции станут более понятными.
В начале была дарвиновская эволюция видов путем естественного отбора. В процессе более или менее случайных рекомбинаций и мутаций генов вслепую было создано множество различных организмов-кандидатов. Эти организмы прошли испытание в полевых условиях, и среди них выжили только сконструированные наилучшим образом. Это первый этаж башни. Давайте назовем его обитателей дарвиновскими созданиями.
Рис. 4.1
Этот процесс прошел через многие миллионы циклов, произведя на свет множество удивительных конструкций, как растительных, так и животных. В конечном счете, среди его новых созданий оказались некоторые конструкции, обладающие свойством фенотипической пластичности, т.е. конструкция отдельных организмов-кандидатов не определялась полностью при рождении; в ней присутствовали элементы, которые могли быть откорректированы событиями, происходившими во время полевых испытаний.
Некоторые из этих кандидатов, как мы можем предположить, жили не лучше своих собратьев, дарвиновских созданий с жестко фиксированной конструкцией, так как у них не было возможности предпочитать (выбирать «на бис») те варианты поведения, «для испытания» которых у них было все необходимое. Но другие, можно предположить, были более удачливы и имели вмонтированные «подкрепители», которым случалось поощрять совершение «умных» шагов, т.е. действий, которые были лучшими среди доступных для кандидатов. Таким образом, эти особи, сталкиваясь с окружающей средой, совершали разнообразные действия, опробывая их одно за другим, пока не находили то, которое срабатывало. Они обнаруживали это, только получив положительный либо отрицательный сигнал от окружающей среды, который корректировал вероятность повторного совершения этого действия в другой раз. Конечно, любые создания с неправильным монтажом — подкрепляющим совершение негативных вместо позитивных действий — были обречены. Только те, кому посчастливилось родиться с подходящими подкрепителями, обладали преимуществом. Мы можем называть этот подкласс дарвиновских созданий скиннеровскими созданиями, поскольку, как любил отмечать психолог-бихевиорист В. Ф. Скиннер, такое «оперантное научение» не является простым аналогом дарвиновского естественного отбора, а служит дополнением к нему:
«Там, где заканчивается врожденное поведение, начинается врожденная модифицируемость процессов выработки условных рефлексов» (1953, с. 83).
Рис. 4.2
Произошедшая в 1970-х годах когнитивная революция лишила бихевиоризм его господствующего положения в психологии, и с тех пор существует тенденция недооценивать возможности скиннеровского научения (или его разновидностей) в превращении набора поведенческих реакций организмов в высоко адаптивные и способные к различению структуры. Однако успешные исследования по нейросетям и «коннекционизм» в 1990-х годах заново продемонстрировали порой удивительную виртуозность простых сетей, которые начинают жизнь, имея более или менее беспорядочные соединения, а затем корректируют их при помощи простой разновидности «опыта» — пережитой ими истории подкреплений.
Основополагающая идея о том, что окружающая среда играет роль слепого отбора в формировании психики (или мозга, или системы управления), свое происхождение ведет не от Дарвина, а из более глубокого прошлого. Предшественниками сегодняшних коннекционистов и вчерашних бихевиористов были ассоцианисты, т.е. такие философы, как Дэвид Юм, который попытался в XVIII веке представить, каким образом части ума (он называл их впечатлениями и идеями) могут самоорганизовываться без помощи некоего всезнающего управляющего. Помнится, как однажды один студент сказал мне: «Юм хотел, чтобы идеи сами думали». У Юма были замечательные догадки о том, как впечатления и идеи могут соединяться друг с другом в ходе процесса, напоминающего образование химических соединений, а затем прокладывать в душе проторенные тропинки привычек, но эти догадки были слишком смутными, чтобы их можно было проверить. Однако ассоцианизм Юма напрямую вдохновлял Павлова в его знаменитых экспериментах по выработке условных рефлексов в поведении животных, которые, в свою очередь, привели к созданию несколько иных теорий условных рефлексов Э.Л.Торндайком, Скиннером и другими психологами-бихевиористами. Некоторые из этих исследователей, в частности Дональд Хебб, попытались более тесно связать свой бихевиоризм с тем, что тогда было известно о мозге.
В 1949 году Хебб предложил модели простых механизмов научения, которые могут корректировать соединения между нервными клетками. Эти механизмы (сейчас называемые хеббовскими правилами научения) и их потомки служат двигателем изменений в коннекционизме, последнем проявлении этой традиции.
Ассоцианизм, бихевиоризм, коннекционизм — их исторический и алфавитный порядок позволяет проследить эволюцию моделей одного простого вида научения, которое может быть названо ABC (или начальным[13] научением. Нет сомнений в том, что большинство животных способны к АВС-научению, т.е. они могут начать видоизменять (или переконструировать) свое поведение в соответствующих направлениях в результате долгого и устойчивого процесса дрессировки или формирующего воздействия со стороны окружающей среды. Сейчас существуют хорошие модели, различающиеся своей реалистичностью и детальностью, которые показывают, как такой процесс научения и дрессировки может осуществляться отнюдь не чудодейственным образом в сети нервных клеток.
Для многих жизненно важных целей (например, для распознавания образов, различения, обобщения и динамического управления передвижением) ABC-сети замечательно подходят — они эффективны, компактны, надежны в работе, отказоустойчивы и относительно легко переконструируются на ходу. Более того, такие сети придают убедительность мысли Скиннера о том, что не очень важно, где мы проведем границу между тем, что формируется путем естественного отбора и генетически передается потомству (монтаж, с которым вы родились), и тем, что формируется позднее в самой особи (окончательный перемонтаж в результате опыта или дрессировки). Природа и научение сливаются воедино. Есть, однако, некоторые когнитивные приемы, которым пока еще не могут обучаться такие ABC-сети, и (более веский аргумент) есть некоторые когнитивные приемы, которые вообще не являются результатом дрессировки. Некоторые животные, видимо, способны к «научению с первого раза»; они могут усваивать некоторые вещи, не пройдя через трудный и жестокий процесс проб и ошибок, который является признаком всякого АВС-научения.
Скиннеровское научение неплохая вещь, если только вы не погибнете из-за какой-нибудь допущенной вами ранее ошибки. Более совершенная система включает в себя предварительный отбор среди всех возможных видов поведения или действий, позволяющий отбраковывать по-настоящему глупые шаги до того, как их рискнут совершить «в реальной жизни». Мы, люди, являемся созданиями, способными к этому особому усовершенствованию, но в этом мы не одиноки. Мы можем назвать владельцев этого третьего этажа Башни попперовскими созданиями, поскольку, как однажды ясно сформулировал философ сэр Карл Поппер, это конструктивное усовершенствование конструкции «позволяет нашим гипотезам умирать вместо нас». В отличие от скиннеровских созданий, многие из которых выживают только потому, что совершают удачные первые шаги, попперовские создания выживают потому, что они достаточно умны, чтобы делать свои первые шаги, не полагаясь на удачу. Конечно, им всего лишь повезло, что они умны, но быть умным лучше, чем просто удачливым.
Рис. 4.3
Как должен происходить этот предварительный отбор у попперовских агентов? Должен существовать некий фильтр, и любой такой фильтр должен быть равнозначен чему-то вроде внутренней среды, в которой можно выполнять безопасные испытания, т.е. чему-то внутреннему, структурированному таким образом, что поощряемые им суррогатные действия чаще оказываются теми действиями, которые получили бы благословение в реальном мире, будь они совершены. Короче говоря, внутренняя среда, чем бы она ни была, должна содержать большое количество информации о внешней среде и ее регулярностях. Ничто иное (за исключением магии) не могло бы придать ценность предварительному отбору. (Всегда можно было бы подбросить монетку или обратиться к оракулу, но это ничем не лучше слепого метода проб и ошибок, если только на монетку или оракула систематически не оказывают влияния кто-либо, располагающий истинной информацией о мире.)
Привлекательность идеи Поппера подтверждают недавние разработки реалистичных авиационных имитаторов, используемых для тренировки пилотов самолетов. В условиях имитированного полета пилот, не подвергая риску свою жизнь (или дорогостоящий самолет) обучается тому, какие следует предпринять действия в критических ситуациях. Однако в одном отношении авиационные имитаторы являются обманчивым примером попперовского приема: они воспроизводят реальный мир слишком скрупулезно. Мы должны предостеречь себя от мысли, что внутренней среда у попперовского создания является простой копией внешнего мира со всеми его физическими случайностями. В таком чудотворном игрушечном мире, разместившемся в вашей голове, маленькая раскаленная печка должна была бы быть достаточно горячей, чтобы обжечь прикоснувшийся к ней маленький палец! Не нужно представлять себе ничего подобного. Там должна быть информация о последствиях прикосновения пальцем к плите, и она должна быть в таком виде, чтобы вызвать эффект предупреждения при обращении к ней во время внутренних испытаний, но этот эффект может быть достигнут и без создания копии мира. В конце концов, в равной мере попперовским было бы обучение пилотов, при котором им просто давали бы прочесть книгу, разъясняющую все непредвиденные обстоятельства, с которыми они могут столкнуться, взобравшись в кабину самолета. Это, возможно, не столь эффективный метод обучения, но он несравнимо лучше, чем пробы и ошибки в небе!
Общей чертой всех попперовских созданий является то, что в них тем или иным способом (врожденным или приобретенным) размещена информация — точная информация о мире, с которым они (вероятно) столкнутся, — и эта информация содержится в таком виде, что позволяет осуществить предварительный отбор, который служит ее raison d’etre.[14]
Один из способов достижения попперовскими созданиями полезной фильтрации состоит в том, чтобы отдать возможные варианты поведения на суд тела и воспользоваться мудростью, накопленной в его тканях, какой бы устаревшей и недальновидной она ни была. Если тело взбунтуется, отреагировав, например, таким типичным образом, как тошнота, головокружение или трепетание от страха, то это является не вполне надежным (но лучшим, чем подбрасывание монетки) знаком того, что предполагаемое действие может не быть удачным. Как мы видим, вместо того, чтобы перемонтировать мозг и тем самым исключить подобные действия, превратив их в абсолютно немыслимые, эволюция может просто устроить все так, чтобы ответом на любую мысль о них была столь сильная негативная реакция, что становится практически невозможной их победа в борьбе за осуществление. Та информация в теле, на которой основана эта реакция, может быть размещена там согласно генетическому рецепту либо благодаря недавнему индивидуальному опыту. Когда младенец впервые учится ползать, он испытывает врожденное отвращение к тому, чтобы выползать на стеклянную поверхность, сквозь которую он видит «визуальный обрыв». И даже если рядом его манит, уговаривает и подбадривает мать, ребенок в страхе отползает назад, несмотря на то, что он еще ни разу в своей жизни не падал. Опыт его предков заставляет его перестраховаться. Когда крыса съедает незнакомую пишу, а затем ей вкалывают вещество, вызывающее у нее рвоту, она впоследствии будет проявлять сильное отвращение к пище, которая выглядит и пахнет так же, как та, которую она ела перед рвотой. Здесь информация, заставляющая ее перестраховаться, была получена из ее собственного опыта. Ни один фильтр не совершенен — в конце концов, стеклянная поверхность безопасна, а новая пища крысы не ядовита, но лучше не рисковать, чем сожалеть.
Искусные эксперименты психологов и этологов подсказывают иные способы, при помощи которых животные могут опробовать действия «в уме» и тем самым пользоваться попперовским преимуществом. В 1930-х и 1940-х годах бихевиористы доказывали себе снова и снова, что их подопытные животные способны к «латентному научению» в окружающем их мире — научению, которое не вознаграждается в виде какого-либо обнаруживаемого подкрепления. (Их упражнения в самоопровержении сами служат превосходным примером для другой попперовской темы: наука развивается вперед, только когда выдвигает опровергаемые гипотезы.) Если крыс оставить в лабиринте, в котором нет сыра или какого-либо другого вознаграждения, они просто будут осваиваться в окружающей обстановке обычным способом; если же затем положить в лабиринт нечто ценное, то крысы, освоившиеся в лабиринте во время предшествующих вылазок, будут намного лучше находить это (неудивительно!), чем крысы из контрольной группы, видящие лабиринт в первый раз. Это может показаться ничтожным открытием. Разве и раньше не было очевидным, что крысы достаточно умны, чтобы осваиваться в окружающей обстановке? И да, и нет. Это могло казаться очевидным, но именно такого рода проверка — проверка, имеющая своим фоном нулевую гипотезу, — должна быть выполнена, если мы хотим удостовериться в том, насколько разумны различные виды животных. Как мы увидим, другие эксперименты с животными демонстрируют их удивительную глупость — почти невероятные пробелы в их знании окружающей среды.
Бихевиористы отважно старались подогнать латентное научение под свои ABC-модели. Одним из их наиболее эффектных паллиативов было постулирование такого влечения, как «любопытство», которое удовлетворялось (или, как они говорили, «ослаблялось») в процессе исследования. В конце концов, подкрепление осуществлялось и в этих не содержащих подкрепления средах. Любая окружающая среда наполнена подкрепляющими стимулами просто потому, что в ней есть чему обучаться. Как попытка спасти ортодоксальный бихевиоризм, этот шаг был совершенно бессмысленным, но сама идея вовсе не безнадежна в других контекстах; она означает признание того, что любопытство — эпистемический голод — должно побуждать к действию любую мощную обучающуюся систему.
Мы, люди, способны к ABC-научению, поэтому мы являемся скиннеровскими созданиями, но не только ими. Мы также пользуемся благами того, что является во многом генетически наследуемым и жестко вмонтированным, поэтому мы еще и дарвиновские создания. Но, сверх того, мы являемся попперовскими созданиями. Какие еще животные относятся к попперовским созданиям, а какие — к просто скиннеровским? Любимыми подопытными животными Скиннера были голуби; он и его последователи развили технологию оперантного научения до очень высокого уровня, добиваясь усвоения голубями удивительно странных и совершенных видов поведения. Примечательно, что скиннерианцам так и не удалось доказать, что голуби не являются попперовскими созданиями; исследование же множества других видов животных, от осьминогов и рыб до млекопитающих, дает веские основания предположить, что если и существуют чисто скиннеровские создания, способные обучаться только слепым методом проб и ошибок, то их можно найти лишь среди простейших беспозвоночных. Огромный морской слизень (или морской заяц) Aplysia californica до некоторой степени заменил голубя в качестве объекта внимания со стороны тех, кто изучает механизмы простого научения.
Следовательно, мы не отличаемся от остальных видов животных тем, что являемся попперовскими созданиями. Отнюдь, млекопитающие, птицы, рептилии, амфибии, рыбы и далее многие беспозвоночные проявляют способность использовать общую информацию, получаемую из окружающей их среды, для предварительной сортировки своих вариантов поведения. Каким образом новая информация о внешней среде встраивается в их мозг? Очевидно, через восприятие. Окружающая среда предоставляет слишком богатый выбор, в ней намного больше информации, чем мог бы использовать даже познающий ангел. Механизмы восприятия сконструированы таким образом, чтобы игнорировать большую часть поступающих стимулов и концентрироваться на наиболее полезной, наиболее надежной информации. Каким же образом собранная информация оказывает рефлективное влияние при «рассмотрении» животным вариантов поведения, помогая ему выстраивать все более эффективные взаимодействия с миром? Без сомнения, существует множество различных механизмов и методов, но среди них есть и такие, когда тело используется в качестве резонатора.