Глава 7 ГОВОРЯЩИЕ ГОЛОВЫ[94] Как мы понимаем язык и используем его в речи

Глава 7

ГОВОРЯЩИЕ ГОЛОВЫ[94]

Как мы понимаем язык и используем его в речи

На протяжении столетий людей ужасала возможность того, что созданные ими вычислительные машины могут перехитрить их, в чем-то превзойти или лишить рабочих мест. Этот страх часто обыгрывался в литературе, начиная со средневековой еврейской легенды о Големе, глиняном истукане, ожившем, когда ему в рот вложили надпись с именем Бога, до HAL — взбунтовавшегося компьютера из «Космической одиссеи 2001». Но когда в 1950-х гг. возникла такая отрасль прикладной науки, как «искусственный интеллект» («Artificial intelligence» — AI), создалось впечатление, что научная фантастика грозит обернуться пугающей реальностью. Когда компьютер высчитывает число «пи» до миллионного знака после запятой или начисляет зарплату сотрудникам фирмы, то нетрудно признать его право на существование, но вдруг обнаружилось, что компьютеры еще и доказывают логические теоремы и играют в шахматы на высоком уровне. В последующие годы появились компьютеры, которые могли обыграть любого, за исключением гроссмейстера, и программы, превосходившие многих экспертов, когда речь шла о рекомендациях — какие подобрать лекарства при бактериальных инфекциях или куда инвестировать пенсионные фонды. А раз компьютеры решали такие требующие умственного напряжения задачи, казалось, дело лишь во времени — и СЗРО[95] или Терминатора можно будет заказать по каталогу. Единственное, что оставалось, это запрограммировать компьютеры на выполнение простых заданий. Согласно легенде, в 1970-х гг. Марвин Минский, один из создателей AI, дал своему аспиранту такое задание на лето — написать «зрительную программу».

Но домашние роботы все еще оставались в области фантастики. Главный урок, извлеченный разработчиками AI после тридцати пяти лет работы состоял в том, что сложные проблемы просты, а простые сложны. То, что доступно разуму четырехлетнего ребенка и для нас является само собой разумеющимся — узнать знакомое лицо, поднять карандаш, пересечь комнату, ответить на вопрос — в действительности является решением одних из самых сложных технологических проблем. Пусть вас не вводят в заблуждение роботы на конвейере в рекламных роликах автомобилей: все, чем они занимаются — это сварка и распыление краски — а такие задачи не требуют обязательного присутствия неуклюжего мистера Магу[96], который бы за чем-то наблюдал, что-то держал или что-то куда-то клал. Если вы хотите поставить в тупик систему искусственного интеллекта, задайте ей следующие вопросы: «Что больше — Чикаго или хлебница?», «Носят ли зебры нижнее белье?», «Может ли пол подняться и покусать вас?», «Если Сьюзен идет в магазин, идет ли ее голова вместе с ней?». Большинство страхов перед автоматическими системами основано не на том, что действительно должно вызывать опасения. Это аналитикам финансового рынка, инженерам нефтехимической отрасли и членам судейской коллегии стоит опасаться, что с появлением нового поколения разумных машин они потеряют работу и будут вытеснены последними. Садовники, портье и повара могут в ближайшие десятилетия быть уверены, что останутся на своих местах.

Понимание предложения — это одна из вышеупомянутых тяжелых легких проблем. Чтобы общаться с компьютерами нам все еще приходится учить их языки, сами они недостаточно умны, чтобы выучить наши. Вообще, это слишком легко — думать, что компьютеры понимают больше, чем они на самом деле способны понять.

Недавно был учрежден ежегодный конкурс, какая компьютерная программа лучше всего введет в заблуждение пользователя, заставив думать, что он общается с человеком. Целью этого конкурса на премию Лобнера (Loebner Prize) было воплотить предположение, сделанное Аланом Тьюрингом в знаменитой работе 1950 г. Он предложил использовать для ответа на философский вопрос «Может ли машина мыслить?» имитационную игру, где арбитр разговаривает с человеком через один терминал и с компьютером, запрограммированным на имитацию человека — через другой. Если арбитр не может отличить, кто где, то, по мысли Тьюринга, нет оснований отрицать, что компьютер может думать. Если отбросить философию, то для конкурсной комиссии было очевидно, что ни одна программа не сможет и близко подойти к выигрыванию премии в 100 000 долларов, поэтому ее размер был уменьшен до 1 500 долларов, что было честнее по отношению к машине. Каждый из арбитров должен был придерживаться одной темы беседы, выбранной программистом или конкурирующим с компьютером человеком, кем бы он ни был, и арбитру не позволялось использовать никаких «хитростей или уловок», например, повторять вопрос десять раз или спрашивать, носят ли зебры нижнее белье; беседа должна была быть «естественной». После примерно семи минут общения с каждой из нескольких программ и их соперников-людей, арбитры указали на то, что все люди более «человекоподобны», чем любой из компьютеров. Тем не менее, около половины арбитров спутали выигравшую программу с человеком.

Это достижение является менее впечатляющим, чем кажется. Правила связали арбитрам руки: «неестественные хитрости и уловки» — это иное название любой попытки установить, разговариваешь ты с человеком или с машиной, что и является смыслом конкурса! Кроме того, программист-победитель тонко использовал возможность выбирать тему беседы для своей программы. Он выбрал «эксцентричную беседу», которая является сомнительным примером «темы» и сама по себе может быть полна непоследовательностей:

Арбитр: Как долго тянется этот день! Но теперь, мне кажется, я готов немного поразвлечься. Погода сегодня не очень хорошая. Знаешь ли ты какие-нибудь шутки, которые могли бы разогнать облака?

Компьютер: Все говорят о погоде, но, похоже, никто ничего с ней не делает. Почему тебе обязательно нужно было мне сказать, что теперь ты готов немного поразвлечься? О-о-о-ох…

Арбитр: Ты хочешь запутать меня, да? Я просто объяснил, что готов поразвлечься!

Компьютер: Не лучше ли сказать, если бы это была неправда, что я пытаемся[97] запутать тебя, да? Я просто объяснил, что готов поразвлечься! Я, следовательно, я вычисляю… Почему ты думаешь, что я пытаюсь запутать тебя, не правда ли?

Арбитр: Не могу сказать, что понимаю вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.

Компьютер: Откуда ты знаешь, что не можешь сказать, что понял вопрос… Но эксцентричность поэта — это одно, а эксцентричность большинства из нас — другое.

По сути программист просто усовершенствовал технологию, изобретенную в 1965 г. ученым-компьютерщиком Джозефом Вейценбаумом. Вейценбаум написал туповатую программу, названную ELIZA в честь героини Бернарда Шоу; эта программа искала несколько ключевых слов во вводимой строке, извлекала фиксированный ответ из списка и вставляла фрагменты вводимой строки в ответ (с некоторыми небольшими изменениями, например «ты» вместо «я»). Таким образом в примитивной форме имитировалась беседа. Один вариант программы под названием Doctor копировал поведение психотерапевта — приверженца философии Карла Роджерса, считавшего, что терапевт должен повторять пациенту его же собственные утверждения для их осмысливания. Эта версия программы позже продавалась как компьютерная игра в магазинах «Рейдио Шэк»[98], а другая версия поступает в комплекте с моим текстовым редактором GNU Emacs. (В документации сказано: «Если при использовании Emacs что-то не получается, и ни один из указанных выше приемов не решает проблему, Emacs все же может вам помочь. Наберите: „M-x doctor RET“».) Вот типичный диалог:

Пользователь: В последнее время я чувствую себя порядком подавленным.

Компьютер: Вы часто чувствуете себя подавленным?

Пользователь: Да, почти все время.

Компьютер: Почему вы говорите «да, почти все время»?

Пользователь: Вот сейчас я чувствую, что готов заплакать.

Компьютер: Вы пришли ко мне потому, что сейчас чувствуете, что готовы заплакать?

К ужасу Вейценбаума, однажды он увидел, как его секретарша припала к терминалу и изливает душу программе.

У большинства ученых-компьютерщиков конкурс на премию Лобнера вызывает раздражение. Они считают его не имеющим научной ценности рекламным трюком, задача которого — обвести вокруг пальца непрофессионала, а не научить компьютер речи. (Разработчикам искусственного интеллекта и другим профессионалам, разбирающимся в проблемах языка, не разрешили быть арбитрами, но ни один из них и не рвался участвовать в конкурсе, заявки поступали от любителей.) Этот конкурс примерно так же продуктивен, как будет продуктивна реклама биологических исследований, если на премию выдвинуть создателя искусственного цветка из шелка, самого похожего на естественный; или как будет продуктивна работа над космической программой, где высадка на Луну осуществится на съемочной площадке Голливуда. Была проведена интенсивная работа по созданию компьютерных систем, понимающих язык, но ни у одного серьезного инженера не хватит дерзости утверждать, что система, дублирующая языковые способности человека, появится в недалеком будущем.

В действительности, с точки зрения ученого, люди не имеют права так хорошо понимать предложения, как они это делают. Они не просто решают до абсурда сложную задачу, но еще и делают это быстро. Понимание, как правило, происходит в режиме «реального времени». Слушающий действует синхронно с говорящим, а не ждет конца отрезка речи, чтобы истолковать его через соразмерный промежуток времени, подобно критику, пишущему рецензию на книгу. А временной промежуток между тем, что произнес говорящий, и тем, что воспринял слушающий, чрезвычайно короток: один или два слога за половину секунды. Некоторые люди могут понимать и повторять предложения, следуя за речью говорящего с отставанием на четверть секунды!

Понимание процесса понимания имеет и иное практическое применение, помимо создания машин-собеседников. Понимание предложений людьми происходит быстро и эффективно, но не идеально. Оно работает, когда воспринимаемый поток речи или текст определенным образом структурирован. В противном случае процесс может забуксовать, пойти в обратном направлении, и возникнет неправильное понимание. Исследуя понимание языка в этой главе, мы выясним, какие виды предложений могут путаться в сознании человека, воспринимающего речь. Один из практических источников информации — это набор рекомендаций для написания ясной прозы, научное руководство по стилистике, например то, что написано Джозефом Уильямсом в 1990 г., — «Стиль: как добиться ясности и изящества», в нем содержатся многие лингвистические находки, которые мы будем рассматривать.

Другое практическое применение связано с областью права. Судьи часто сталкиваются с тем, что им приходится гадать, как среднестатистический человек воспримет двусмысленный отрывок текста, например, при изучении клиентом контракта, заслушивании инструкций присяжными и чтении представителем общественности потенциально клеветнической характеристики. Многие из человеческих привычек толкования текста были определены благодаря лабораторным исследованиям, а лингвист и юрист Лоренс Солэн объяснил связь между языком и правом в своей интересной книге 1993 г. «Язык судей», к которой мы еще обратимся.

* * *

Как происходит понимание предложения? Первый этап — это синтаксический разбор. Он не имеет отношения к тем упражнениям, которые вы, стиснув зубы, делали в начальной школе, и о которых у Дейва Барри, ведущего газетной рубрики «Спроси у Господина Языка», осталось такое воспоминание:

Вопрос: Пожалуйста, объясните, как составить схему предложения.

Ответ: Прежде всего расположите предложение на чистой ровной поверхности, например, на гладильной доске. Затем, используя остро отточенный карандаш или скальпель, вычлените «сказуемое», которое показывает, где произошло действие, и обычно расположено прямо за жабрами. Например, в предложении «ЛаМонт никогда не привести в порядок лесникам» действие, очевидно, происходит в лесу. Таким образом, ваша схема будет напоминать по форме деревце, с ветвями, выпирающими из него, чтобы указать на расположение различных частиц речи, таких как ваши герундии, провербы, второстепенности и т.д.

Но понимание действительно включает сходный с этим процесс нахождения подлежащего, сказуемого, дополнения и т.д., который происходит бессознательно. Если только вы не Вуди Аллен, в ускоренном темпе читающий «Войну и Мир», вам нужно сгруппировать слова в синтаксические группы, определить, что является группой подлежащего при каком сказуемом, и так далее. Например, чтобы понять предложение The cat in the hat came back ‘Кошка в шляпе вернулась’ нужно объединить в одну группу слова the cat in the hat ‘кошка в шляпе’, чтобы понять, что это кошка вернулась, а не шляпа. Чтобы отличить предложение Dog bites man ‘Собака кусает человека’ от Man bites dog ‘Человек кусает собаку’ нужно найти подлежащее и объект. А чтобы различить предложения Man bites dog ‘Человек кусает собаку’, Man is bitten by dog ‘Человек искусан собакой’ и Man suffers dog bite ‘Человек перенес укус собаки’, нужно обратиться к словарным статьям упомянутых глаголов в ментальном словаре, чтобы определить, что происходит с подлежащим человек.

Сама грамматика является просто кодом или протоколом, статичной базой данных, определяющей, какие виды звуков соответствуют каким видам значения в определенном языке. Это не рецепт и не программа для говорения и понимания. Говорение и понимание основаны на одной и той же базе данных (язык, на котором мы говорим, это тот же язык, который мы понимаем), но им также необходимы процедуры, которые бы четко, шаг за шагом, обозначили, что необходимо делать сознанию, когда становятся слышимыми слова, или когда сам собираешься начать говорить. Ментальная программа, анализирующая структуру предложения во время восприятия речи, называется «синтаксическим анализатором» («parser»).

Наилучший способ понять, как работает процесс понимания, это проследить за синтаксическим разбором простого предложения, порожденного какой-нибудь простенькой грамматикой, например той, что упоминалась в главе 4, и которую я повторяю здесь:

S —> NP VP

«Предложение может состоять из именной группы и глагольной группы».

NP —> (det) N (РР)

«Именная группа может состоять из присутствующего факультативно детерминатора, имени существительного и присутствующей факультативно предложной группы».

VP —> V NP (PP)

«Глагольная группа может состоять из глагола, именной группы и факультативно присутствующей предложной группы».

РР —> P NP

«Предложная группа может состоять из предлога и именной группы».

N —> boy ‘мальчик’, girl ‘девочка’, dog ‘собака’, cat ‘кошка’, ice-cream ‘мороженое’, candy ‘конфета’, hot dogs ‘сосиски’

«К именам существительным в ментальном словаре относятся слова: мальчик, девочка, …»

V —> eats ‘ест’, likes ‘любит’, bites ‘кусает’

«К глаголам в ментальном словаре относятся слова: eats ‘ест’, likes ‘любит’, bites ‘кусает’».

Р —> with ‘с’, in ‘в’, near ‘около’

«К предлогам относятся слова: with ‘с’, in ‘в’, near ‘около’».

det —> a ‘какой-то’, the ‘этот’, one ‘один какой-то’

«К детерминаторам относятся слова: a ‘какой-то’, the ‘этот’, one ‘один какой-то’».

Возьмем предложение The dog likes ice-cream ‘Эта собака любит мороженое’. Первое слово, с которым сталкивается ментальный синтаксический анализатор — это the. Синтаксический анализатор наводит о нем справки в ментальном словаре; это то же самое, что обнаружить данное слово в правой части правила и выяснить его категорию, указанную в левой части. Это детерминатор (determiner, det). Следовательно синтаксический анализатор может вырастить первую веточку предложения на дереве. (Правда, дерево, растущее сверху вниз от листьев к корням невозможно в ботанике.)

Детерминаторы, как и все слова, должны быть частью какой-либо большей синтаксической группы. Синтаксический анализатор может вычислить, какая именно синтаксическая группа имеется в виду, проверив, в правой части какого правила имеется «det». Это будет правило, определяющее именную группу, NP. Дерево может быть продолжено:

Эта обособленная структура должна быть удержана в некой определенной памяти. Синтаксический анализатор запоминает, что находящееся в нашем распоряжении слово the является частью именной группы, которая скоро должна быть укомплектована словами, которые заполнили бы остальные слоты, в данном случае — по меньшей мере одним существительным.

Тем временем дерево продолжает расти, поскольку именные группы не могут оставаться ни к чему не присоединенными. Проверив, правая сторона каких правил содержит символ NP, синтаксический анализатор имеет несколько вариантов на выбор. Только что построенная именная группа может быть частью предложения, частью глагольной группы или частью предложной группы. Эту задачу выбора можно решить, исходя из главного: все синтаксические группы должны быть в итоге включены в предложение (S), а предложение должно начинаться с именной группы, поэтому, чтобы продолжить дерево, логично использовать правило построения предложения:

Обратите внимание, что теперь синтаксический анализатор удерживает в памяти две неукомплектованных ветви: именная группа, для укомплектования которой требуется имя существительное, и предложение, для укомплектования которого требуется глагольная группа.

Обособленная именная ветвь аналогична предсказанию того, что следующее слово должно быть именем существительным. И когда дело доходит до следующего слова dog ‘собака’, просмотр правил подтверждает такое предсказание: слово dog — это часть правила для имени существительного. Это позволяет слову dog быть включенным в дерево, укомплектовывая именную конструкцию:

Синтаксическому анализатору больше не нужно помнить, что следует укомплектовать NP, все, что нужно держать в памяти, — это неукомплектованное S.

На данном этапе можно в какой-то степени предположить значение предложения. Вспомните о том, что одно существительное в именной группе является ядром — вершиной (то, о чем говорит вся группа), а остальные синтаксические группы в составе именной могут определять это существительное. Найдя определения слов dog и the в их словарных статьях, синтаксический анализатор может отметить, что именная группа говорит о какой-то ранее упоминавшейся собаке.

Следующее слово likes ‘любит’ оказывается глаголом. Глаголу неоткуда было взяться, кроме как из глагольной группы, VP, существование которой, к счастью, уже было предсказано, поэтому два этих элемента можно соединить друг с другом. Глагольная группа содержит больше, чем один глагол, она содержит также и именную группу (свое дополнение). Таким образом, синтаксический анализатор предсказывает, что следующее, с чем мы будем иметь дело — это именная группа:

Следующее на очереди — ice-cream ‘мороженое’ — существительное, которое может быть частью именной группы — в точности как предсказывает обособленная ветвь NP. Последние кусочки головоломки идеально укладываются на свое место:

Слово ice-cream ‘мороженое’ укомплектовало именную группу, поэтому ее нет необходимости больше держать в памяти; NP укомплектовала глагольную группу, поэтому и о ней тоже можно забыть, a VP укомплектовала предложение. Когда память освобождается от всех неукомплектованных обособленных ветвей, мы чувствуем в смзнании «щелчок», который свидетельствует о том, что мы только что услышали полностью укомплектованное грамматически правильное предложение.

Одновременно с выращиванием ветвей дерева синтаксический анализатор также выстраивал значение предложения, используя определения в ментальном словаре и принципы их сочетаемости. Глагол является вершиной своей глагольной группы, поэтому VP говорит о любви к чему-либо. NP ice-cream ‘мороженое’ в составе VP является дополнением глагола. Словарная статья для слова likes ‘любит’ говорит о том, что дополнением к этому глаголу будет нечто, вызывающее любовь; отсюда следует, что VP сообщает о любви к мороженому. NP слева от спрягаемого глагола — это подлежащее; словарная статья для likes говорит о том, что подлежащим при этом глаголе будет то, что может испытывать любовь. Совмещая семантику подлежащего с семантикой VP, синтаксический анализатор определил, что в предложении утверждается факт любви вышеупомянутого представителя семейства псовых к замороженным сладостям.

* * *

Почему же так сложно запрограммировать компьютер на выполнение такой же операции? Почему и для людей она тоже внезапно становится трудной при чтении бюрократических документов и других образцов плохого стиля? Пройдя по предложению в роли синтаксического анализатора, мы столкнулись с двумя трудностями на пути к получению результата. Первая — это память: нам нужно было удерживать в памяти неукомплектованные группы, которые требовали для комплектации определенные виды слов. Вторая — это принятие решения: когда синтаксическая группа находилась с правой стороны двух различных правил, нам нужно было принять решение, какое из них использовать, чтобы вырастить следующую ветвь дерева. В соответствии с первым правилом искусственного интеллекта о легкости сложных проблем и сложности легких выходит, что часть, относящаяся к памяти, легка для компьютеров и тяжела для людей, а часть, относящаяся к принятию решений, легка для людей (по крайней мере, если предложение было правильно построено) и тяжела для компьютеров.

Синтаксический анализатор предложения требует наличия многих видов памяти, но та, необходимость в которой очевиднее всего, — это память на неукомплектованные конструкции, запоминание того, что подвергается синтаксическому разбору. Компьютеры должны отвести для этой цели набор ячеек в своей памяти, так называемый «стеллаж»; ведь именно это и позволяет синтаксическому анализатору использовать грамматику структуры непосредственно составляющих, а не быть простым генератором цепочек слов. Люди также должны выделять некоторый объем своей оперативной памяти под неукомплектованные синтаксические группы. Но оперативная память — это и есть основное «узкое место» в процессе переработки человеком информации. Только несколько единиц — как правило — семь, плюс-минус две — могут одновременно удерживаться в сознании; и к тому же они немедленно начинают «растворяться», или их начинают вытеснять другие. На примере следующих предложений, вы можете увидеть, к чему приводит слишком долгое удерживание в памяти неукомплектованной группы:

He gave the girl that he met in New York while visiting his parents for ten days around Christmas and New Year’s the candy.

‘Он подарил девушке, с которой он встретился в Нью-Йорке, гостя у своих родителей десять дней на рождественские и новогодние праздники, конфеты’.

He sent the poisoned candy that he had received in the mail from one of his business rivals connected with the Mafia to the police.

‘Он отправил отравленную конфету, полученную по почте от одного из своих связанных с мафией конкурентов, полиции’.

She saw the matter that had caused her so much anxiety in former years when she was employed as an efficiency expert by the company through.

‘Она подвергла вопрос, причинивший ей столько беспокойства в прошлые годы, когда она была экспертом по оценке эффективности на своей фирме, анализу’.

That many teachers are being laid off in a shortsighted attempt to balance this year’s budget at the same time that the governor’s cronies and bureaucratic hacks are lining their pockets is appalling.

‘То, что многих учителей увольняют из-за недальновидных попыток сбалансировать бюджет текущего года, в то время, как дружки губернатора и бюрократы набивают карман, возмутительно’.

Эти заставляющие память растягиваться предложения называются в пособиях по стилистике «предложениями с отягощенным началом». В языках, где о значении слов сообщают падежи, тяжелая составляющая может быть просто перенесена в конец предложения, чтобы слушатель мог переварить начало, не имея необходимости удерживать тяжелую составляющую в памяти. Английский язык деспотичен по отношению к порядку слов, но даже он предоставляет альтернативные варианты, в которых порядок составляющих будет изменен. Если внимательно подойти к составлению текста, то эти альтернативы можно использовать, чтобы отодвинуть самую тяжелую составляющую в конец, облегчая задачу для слушателя. Обратите внимание, насколько легче воспринимать эти предложения:

He gave the candy to the girl that he met in New York while visiting his parents for ten days around Christmas and New Year’s.

‘Он подарил конфеты девушке, с которой он встретился в Нью-Йорке, гостя у своих родителей десять дней на рождественские и новогодние праздники’.

He sent to the police the poisoned candy that he had received in the mail from one of his business rivals connected with the Mafia.

‘Он отправил полиции отравленную конфету, полученную по почте от одного из своих конкурентов, связанных с мафией’.

She saw the matter through that had caused her so much anxiety in former years when she was employed as an efficiency expert by the company.

‘Она подвергла анализу вопрос, причинивший ей столько беспокойства в прошлые годы, когда она была экспертом по оценке эффективности на своей фирме’.

It is appalling that teachers are being laid off in a shortsighted attempt to balance this year’s budget at the same time that the governor’s cronies and bureaucratic hacks are lining their pockets.

‘Возмутительно, что многих учителей увольняют из-за недальновидных попыток сбалансировать бюджет текущего года, в то время, как дружки губернатора и бюрократы набивают карман’.

Многие лингвисты полагают, что языки допускают перестановку составляющих или предоставляют выбор из более или менее синонимичных высказываний для того, чтобы облегчить нагрузку на память слушателя.

До тех пор, пока слова в предложении могут быть немедленно объединены в укомплектованные группы, предложение может быть довольно сложным, но тем не менее понятным:

Remarcable is the rapidity of the motion of the wing of the hummingbird.

‘Замечательна скорость движения крыла колибри’.

This is the cow with the crumpled horn that tossed the dog that worried the cat that killed the rat that ate the malt that lay in the house that Jack built.

‘Вот корова со сломанным рогом, что бодала собаку, что гонялась за кошкой, что убила ту крысу, что съела весь солод, лежавший в подвале в доме, который построил Джек’.

Then came the Holy One, blessed be He, and destroyed the angel of death that slew the butcher that killed the ox that drank the water that quenched the fire that burned the stick that beat the dog that bit the cat my father bought for two zuzim.

‘Затем явился Святой, будь Он благословен, и уничтожил ангела смерти, поразившего мясника, что зарезал быка, выпившего воду, что погасила огонь, спаливший палку, которой побили собаку, укусившую кошку, что мой отец купил за два зузима’.

Такие предложения называются «с ветвлением в правую сторону» из-за строения своего синтаксического дерева. Обратите внимание на то, что при продвижении слева направо только одна ветвь в один момент времени остается неукомплектованной:

Предложения также могут иметь ветвление в левую сторону. Деревья с ветвлением в левую сторону больше всего распространены в языках с конечной позицией ядерного элемента, например, в японском, но также встречается и в некоторых английских конструкциях. Как и прежде, синтаксическому анализатору не нужно удерживать в памяти больше одной неукомплектованной ветви единовременно:

букв. ‘Колибриного крыла движения скорость замечательна’.

Есть и третий вид строения дерева, но он воспринимается гораздо тяжелее. Возьмите предложение:

The rapidity that the motion has is remarkable ‘Скорость, которую имеет движение, замечательна’.

Придаточное предложение that the motion has ‘которую имеет движение’ было вставлено в именную группу, содержащую The rapidity ‘Скорость’. То, что получилось в итоге, звучит немного неестественно, но легко поддается пониманию. Можно сказать и так:

The motion that the wing has is remarkable ‘Движение, которым обладает крыло, замечательно’.

Но если вставить группу motion that the wing has ‘движение, которым обладает крыло’ в группу rapidity that the motion has ‘скорость, которую имеет движение’, то результат будет на удивление трудно понять:

The rapidity that the motion that the wing has has is remarkable ‘Скорость, которую имеет движение, которым обладает крыло, замечательна’.

Если же вставить третью группу, например, the wing that the hummingbird has ‘крыло, имеющееся у колибри’, это приведет к появлению «предложения-капусты» с тройным вставлением, что выльется в невозможность его понять[99]:

‘Скорость, которую имеет движение, которым обладает крыло, которое имеет колибри, замечательна’.

Когда синтаксический анализатор в голове у человека сталкивается с тремя has, идущими сразу друг за другом, он начинает буксовать, не зная, что с ними делать. Но проблема не в том, что составляющие, которые надо удерживать в памяти, слишком большие; даже короткие предложения не поддаются пониманию, если они содержат многочисленные вставления:

The dog the stick the fire burned beat bit the cat.

‘Собака, побитая палкой, сожженной огнем, укусила кошку’.

The malt that the rat that the cat killed ate lay in the house.

‘Солод, что съеден крысой, убитой кошкой, хранился в подвале’.

If if if it rains it pours I get depressed I should get help.

‘Мне нужна будет помощь из-за того, что возникла депрессия, что началась из-за дождя, что лил как из ведра’.

That that that he left is apparent is clear is obvious.

‘Очевидно, что это ясно, что налицо тот факт, что он ушел’.

Почему человек терпит абсолютное фиаско, пытаясь истолковать предложения с «капустной» или «матрешечной» структурой? Это одна из наиболее интригующих головоломок, связанных с устройством ментального синтаксического анализатора и ментальной грамматики. Вначале можно даже усомниться в том, что эти предложения грамматически правильны. Может быть, мы перепутали правила, а настоящие правила никак не позволили бы этим словам сочетаться? Может быть, помянутый недобрым словом генератор цепочек слов из 4-й главы, отказывающийся помнить неукомплектованные составляющие, все же правильно имитирует человека? Никоим образом: эти предложения прекрасно выдерживают проверку. Именная группа может содержать определяющее ее придаточное предложение; если можно сказать the rat ‘та крыса’, то можно сказать и the rat that S ‘та крыса, что S’, где S — это предложение, в котором отсутствует объект, определяющий the rat. А предложение the cat killed X ‘кошка убила X’ может содержать именную группу, такую как его подлежащее — the cat. Поэтому, когда мы говорим The rat that the cat killed ‘Крыса, которую убила кошка’, мы определяем именную группу через то, что в свою очередь содержит именную группу. При наличии хотя бы только двух возможностей это сделать и могут появиться «капустные» предложения: стоит только определить именную группу внутри придаточного предложения другим определяющим придаточным предложением. Единственное, чем можно было бы предотвратить появление «капустных» предложений — это заявить, что ментальная грамматика предусматривает существование двух разных типов именных групп: одни из них могут быть определяемыми, а другие могут присутствовать в составе определяющего. Но так быть не может: в этом случае и тому и другому виду именных групп пришлось бы позволить иметь в своем составе тысячи одних и тех же существительных, а артиклям, прилагательным и притяжательным формам — занимать идентичные позиции и т.д. Количество словарных единиц не должно множиться без необходимости, а подобная работенка приведет именно к такому результату. Поместить в ментальной грамматике различные виды групп только для того, чтобы объяснить, почему «капустные» предложения не поддаются пониманию, значило бы сделать грамматику существенно сложнее и дать ребенку для заучивания существенно большее количество правил в период усвоения языка. Проблема должна крыться в чем-то другом.

«Капустные» предложения показывают, что грамматика и грамматический синтаксический анализатор — это разные вещи. Человек может на подсознательном уровне «знать» те конструкции, которые он или она никогда не поймут, точно так же, как Алиса знала, что умеет складывать числа, несмотря на вердикт Черной Королевы:

— Сложению тебя обучали? — спросила Белая Королева. — Сколько будет один плюс один плюс один плюс один плюс один плюс один плюс один плюс один плюс один плюс один?

— Я не знаю, — ответила Алиса. — Я сбилась со счета.

— Сложения не знает, — сказала Черная Королева[100].

Почему же синтаксический анализатор в голове у человека, похоже, сбивается со счета? Разве в оперативной памяти не достаточно места, чтобы удерживать одну или две неукомплектованных группы одновременно? Проблема должна быть более тонкой. Некоторые «капустные» предложения с трехслойной структурой несколько сложны из-за нагрузки на память, но их смысл далеко не так замутнен, как у предложений с has has has:

The cheese that some rats I saw were trying to eat turned out to be rancid ‘Сыр, который, как я заметил, пытались съесть некоторые крысы, оказался тухлым’.

The policies that the students I know object to most strenuously are those pertaining to smoking ‘Те ограничения, против которых студенты, которых я знаю, возражают упорнее всего, связаны с курением’.

The guy who is sitting between the table that I like and the empty chair just winked ‘Тот парень, который сидит между столом, который мне нравится, и свободным стулом, только что моргнул’.

The woman who the janitor we just hired hit on is very pretty ‘Женщина, за которой ухаживает работник, которого мы только что наняли, очень красива’.

Не объем требуемой памяти ставит в тупик грамматический анализатор в голове у человека, но ее тип: удерживание в памяти той или иной составляющей и намерение вернуться к ней снова одновременно с анализом другой составляющей точно такого же типа. Примеры таких «рекурсивных» структур включают, например, относительное придаточное предложение внутри относительного придаточного того же типа и придаточное предложение условия (if… then) внутри другого придаточного условия. Создается впечатление, что синтаксический анализатор в голове у человека следит за тем, где в предложении появляется та или иная составляющая, но не расставляет неукомплектованные в данный момент составляющие, в том порядке, в котором они должны быть укомплектованы, а присваивает номер слоту рядом с каждым типом составляющей уже в контрольном списке. Если какой-либо тип составляющей приходится запоминать более одного раза, когда и первая составляющая (the cat that…), и одного с ней типа составляющая, внутри которой она находится — (the rat that…) могут быть укомплектованы по порядку, в контрольном списке уже не остается места, куда могли бы уместиться оба номера, и составляющие не могут быть укомплектованы должным образом.

* * *

В отличие от памяти, с которой плохо обстоят дела у людей и хорошо — у компьютеров, принятие решений — это та область, в которой люди сильны, а компьютеры слабы. Грамматика в предложении, которое я придумал, была простенькой — «игрушечной», а само предложение, по которому мы прошли шаг за шагом — «детским», таким, что для каждого слова в нем имелась только одна словарная статья (а само слово присутствовало в правой части только одного правила). Но стоит лишь открыть словарь — и вы увидите, у скольких имен существительных имеется вторая словарная статья, где эти слова рассматриваются как глаголы и наоборот. Например, слово dog ‘собака’ имеет вторую — глагольную — словарную статью, что видно из предложения Scandals dogged the administration all year ‘Скандалы сотрясали администрацию весь год’. Аналогично, в реальной жизни hot dog ‘булочка с горячей сосиской’ — это не только существительное, но и глагол, означающий ‘выпендриваться’. И каждый из глаголов в моей игрушечной грамматике также должен иметь вторую словарную статью со значением существительного, потому что носители английского языка могут говорить о дешевой eats ‘жратве’, чьих-либо likes и dislikes ‘любимых и нелюбимых вещах’ и о том, чтобы перехватить несколько bites ‘кусочков’. Даже слово-детерминатор one ‘один’, как в словосочетании one dog ‘одна собака’ может жить и жизнью существительного, как в словосочетании Nixon’s the one ‘Никсон — это тот [кто…]’. Эти локальные двусмысленности приводят грамматический анализатор в замешательство количеством ответвлений на каждом этапе продвижения вперед. Например, встречаясь со словом one в начале предложения, он не может просто построить

но также должен держать в памяти

Точно так же ему придется быстро выстроить две конкурирующие ветви, когда он столкнется со словом dog — одну на случай, если оно окажется существительным, другую — если глаголом. При встрече с one dog придется проверить четыре возможности: детерминатор-существительное, детерминатор-глагол, существительно-существительное и существительное-глагол. Конечно, вариант детерминатор-глагол может быть отклонен, поскольку его не допускает ни одно грамматическое правило, но все же его нужно проверить.

Положение усложняется, когда слова объединяются в синтаксические группы, потому что последние могут входить в состав бо?льших синтаксических групп самыми разными способами. Даже в нашей игрушечной грамматике предложная группа (PP) может входить в состав как именной так и глагольной групп — как в двусмысленном высказывании discuss sex with Dick Cavett ‘обсуждать секс с Диком Кэветом’, автор которого предполагал, что PP with Dick Cavett ‘с Диком Кэветом’ будет входить в состав глагольной группы (обсуждать это с ним), но читатели могли истолковать ее как входящую в состав именной группы (секс с ним). Такие двусмысленности являются правилом, а не исключением; в каждой точке предложения могут встретиться десятки сотен вариантов, которые подлежат проверке. Например, обработав синтаксическую группу The plastic pencil marks… синтаксический анализатор встает перед четырьмя возможными вариантами: это могла быть именная группа из четырех слов, например: The plastic pencil marks were ugly ‘Пометки, сделанные пластиковым карандашом, были уродливы’ или именная группа из трех слов и глагол: The plastic pencil marks easily ‘Делать пометки пластиковым карандашом легко’[101]. В действительности, даже первые два слова The plastic… временно могут ввести в заблуждение; сравните: The plastic rose fell ‘Пластиковая роза упала’ и The plastic rose and fell ‘Пластик поднялся и упал’.

Если бы приходилось только отслеживать все возможные варианты, появляющиеся в каждой точке, компьютер не испытывал бы особых сложностей. Он мог бы несколько минут пробуксовать на простом предложении или израсходовать так много оперативной памяти, что бумага с распечаткой результата протянулась бы до середины комнаты, но в итоге большинство вариантов, возможных в каждой точке, где принимается решение, вступили бы в противоречие с дальнейшей информацией, содержавшейся в предложении. А если так, то в конце предложения должны были бы обозначиться единственное дерево и связанные с ним значения, как это происходило в примере из игрушечной грамматики. Когда локальные двусмысленности не могут быть нейтрализованы, и для одного предложения продолжают быть актуальными два дерева, то мы встречаемся с предложением, которое люди находят двусмысленным, например:

Ingres enjoyed painting his models nude ‘Энгр с удовольствием рисовал натурщиц в обнаженном виде’.

My son has grown another foot ‘Мой сын вырос еще на фут’ или ‘Мой сын отрастил еще одну ступню’.

Visiting relatives can be boring ‘Посещение родственников может быть утомительным’.

Vegetarians don’t know how good meat tastes ‘Вегетарианцы не знают, какой вкус у хорошего мяса’ или ‘Вегетарианцы не знают, насколько хорош вкус мяса’.

I saw the man with the binoculars ‘Я увидел человека в бинокль’ или ‘Я увидел человека с биноклем’.

Но вот в чем проблема. Компьютеры производящие грамматический разбор, настолько въедливы, что им самим это не идет на пользу. Они обнаруживают такие двусмысленности, которые вполне допустимы в рамках английской грамматики, но которые никогда не заметил бы человек, находящийся в здравом уме. Знаменитым примером тому служит один из первых компьютеров, производивших синтаксический разбор, разработанный в Гарварде в 60-е годы. Предложение Time flies like an arrow, конечно же, недвусмысленно, если только существуют недвусмысленные предложения (и если оставить в стороне разницу между буквальным и переносным значением, которые не имеют ничего общего с синтаксисом). Но к удивлению программистов остроглазый компьютер обнаружил в этом предложении пять различных деревьев!

‘Время движется так же быстро, как движется стрела’ (то, как и требовалось это прочитать)

‘Измеряйте скорость мух так же, как вы измеряете скорость стрелы’.

‘Измеряйте скорость мух так же, как стрела измеряет скорость мух’.

‘Измеряйте скорость мух, похожих на стрелу’.

‘Мухи определенного вида — мухи времени — любят стрелу[102].

Среди ученых-компьютерщиков это открытие было обобщено в афоризме: Time flies like an arrow, fruit flies like a banana (fruit ‘фрукт, фруктовый’, banana ‘банан’). Или задумайтесь о строчке из песни: Mary had a little lamb ‘У Мэри был ягненок’. Недвусмысленно? Вообразите, что вторая строчка такова: With mint sauce ‘С мятным соусом’ или: And the doctors were surprised ‘И врачи были удивлены’ или: The tramp! ‘Проститутка!’[103]. Структура может существовать даже в кажущемся бессмысленным наборе слов. Например, приведенная ниже вычурная цепочка слов, придуманная моей студенткой Энни Сенгас — грамматически правильное предложение:

Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo

Американский бизон носит название buffalo. Бизон родом из Buffalo, штат Нью-Йорк, может быть назван Buffalo buffalo. Вспомните также, что есть и глагол to buffalo, означающий ‘разгромить, победить’. Вообразите, что бизоны из штата Нью-Йорк побеждают друг друга: (The) Buffalo buffalo (that) Buffalo buffalo (often) buffalo (in turn) buffalo (other) Buffalo buffalo — (Тот) Buffalo buffalo (который) Buffalo buffalo (часто) buffalo (в свою очередь) buffalo (другого) Buffalo buffalo. Психолингвист и философ Джерри Фодор заметил, что речевка футбольной команды Иельского университета:

Bulldogs Bulldogs Bulldogs Fight Fight Fight!

это грамматически правильное предложение, хотя и с тройным вставлением в середине.

Как же людям удается правильно проанализировать предложения, не отвлекаясь на грамматически допустимые, но неестественные альтернативы? Существуют два возможных объяснения. Первое: наш мозг устроен по образцу компьютерного синтаксического анализатора, который обрабатывает десятки не имеющих будущего фрагментов дерева на заднем плане, и те фрагменты, которые кажутся неприемлемыми, каким-то образом отфильтровываются прежде, чем они достигнут сознания. Второе объяснение: синтаксический анализатор в голове у человека на каждой ступени анализа каким-то образом взвешивает, какая альтернатива является наиболее вероятной, и потом пропахивает дорогу вперед, насколько это возможно, для этого единственного толкования. Ученые-компьютерщики называют такие возможности «вторичный поиск» и «первичный поиск».

Похоже, что на уровне отдельных слов мозг сначала проводит вторичный поиск, принимая во внимание, хотя и не надолго, несколько возможных словарных статей для двусмысленного слова, даже тех, которые вряд ли могут оказаться правильными. Во время одного хитроумного эксперимента психолингвист Дэвид Суинни давал людям прослушать через наушники отрывки следующего типа:

Rumor had it that, for years, the government building had been plagued with problems. The man was not surprised when he found several spiders, roaches, and other bugs in the corner of his room.

Многие годы шла молва, будто здание правительства просто наводнено проблемами. Человек не был удивлен, когда обнаружил, что в углу его кабинета были пауки, тараканы и другие жучки.