Глава 4 МЕХАНИЗМЫ РАБОТЫ ЯЗЫКА Грамматика за работой
Глава 4
МЕХАНИЗМЫ РАБОТЫ ЯЗЫКА
Грамматика за работой
Журналисты говорят, что это не новость, когда собака кусает человека; вот когда человек кусает собаку — это что-то новенькое. И именно в этом заключена суть языкового инстинкта: язык сообщает о чем-то новом. Цепочки слов, называемые «предложениями», не просто подстегивают память, напоминая вам о человеке и лучшем друге человека и предлагая додумать остальное; они сообщают вам, кто произвел какое действие и над кем. Таким образом мы, как правило, получаем больше информации из текстов, чем Вуди Аллен[28] — из «Войны и мира», который был прочитан им за два часа после уроков скоростного чтения: «Это было о каких-то русских». Язык, помимо всего прочего, позволяет нам выяснить, как занимаются любовью осьминоги, как вывести вишневые потеки с платья, почему у Тэда было разбито сердце, смогут ли «Ред сокс» выиграть первенство по бейсболу без хорошего игрока на подаче, как смастерить атомную бомбу в собственном подвале и от чего умерла Екатерина Великая.
Когда ученые видят какое-то явное проявление чудодейства в природе, например, когда летучие мыши выслеживают насекомых в полной темноте или когда лосось возвращается метать икру в родной реке, они начинают искать стоящий за этим естественнонаучный принцип. В случае с летучими мышами это ультразвук; в случае с лососем — следование тончайшей нити запаха. Какое же чудодейство стоит за способностью Homo sapiens сообщать о том, что человек кусает собаку?
В действительности, таких чудодейств не одно, а два, и они ассоциируются с именами двух европейских ученых XIX века. Первый принцип, сформулированный швейцарским лингвистом — Фердинандом де Соссюром, это — «произвольность знака» — полностью условное соответствие звука смыслу. Слово dog ‘собака’ не похоже на собаку, не бегает и не лает, как собака, но тем не менее, означает «собака». Так происходит, поскольку каждый носитель английского языка в детстве прошел одним и тем же путем автоматического запоминания, соединившим звучание со смыслом. Благодаря этому стандартизированному запоминанию члены языкового сообщества получают огромное преимущество: возможность передать мысль из сознания в сознание практически мгновенно. Иногда скоропалительный брак звучания и смысла бывает забавен. Как отмечает Ричард Ледерер в «Безумном английском» («Crazy English»), We drive on a parkway but park in a driveway ‘мы ездим по парковой дороге, но паркуемся на проезжей части’, в гамбургере (hamburger) нет ветчины[29], а в «сладких хлебцах» (sweetbreads) — хлеба[30], голубика (bluberries) действительно синяя (blue), а вот клюква (cranberries) не ходит с клюкой. Но подумайте о «разумной» альтернативе передавать мысли так, чтобы слушатели постигали содержание благодаря форме. Этот вариант так до смешного ненадежен и так напрашивается на остроумное обыгрывание, что мы превратили его в игру, такую как, например, пикшенери[31] или шарады.
Второе чудодейство, лежащее в основе языкового инстинкта, заключено в высказывании Вильгельма фон Гумбольдта, который явился предтечей Хомского: язык «бесконечным образом использует конечные средства». Мы видим разницу между забывающейся фразой Собака кусает человека и таким открытием, как Человек кусает собаку благодаря порядку слов, в котором расположены собака, человек и кусает. Таким образом, мы используем некий код для перевода с одного порядка слов — на другой и с одной комбинаций мыслей — на другую. Этот код, или набор правил, называется генеративной (порождающей) грамматикой; как уже упоминалось, не следует путать ее со школьной и стилистической грамматикой, с которыми мы сталкивались в учебных заведениях.
Принцип, лежащий в основе грамматики, не обычен для естественной, природной среды. Грамматика — это пример «дискретной комбинаторной системы». Конечное число дискретных элементов (в данном случае — слов) отбирается, соединяется, перемещается для создания больших структур (в данном случае — предложений) со свойствами, совершенно отличными от свойств составляющих их элементов. Например, значение предложения Человек кусает собаку отлично не только от значения каждого из трех слов, его составляющих, но также и от значения тех же слов, составленных в обратном порядке. В дискретной комбинаторной системе, такой как язык, может существовать неограниченное число абсолютно отличных друг от друга комбинаций с неограниченным же диапазоном свойств. Другая замечательная дискретная комбинаторная система в естественной среде — это генетический код в ДНК, где четыре вида нуклеотидов комбинируются в шестьдесят четыре вида кодонов, а кодоны могут составлять ряды неограниченного количества различных генов. Многие биологи делали обобщения на основе тесной параллели между принципами грамматических и генетических комбинаций. На профессиональном языке генетиков о рядах ДНК говорят, что они содержат «буквы» и «пунктуацию», могут быть «палиндромические», «не значимые» или «синонимические», их можно «транскрибировать» и «переводить», и даже «хранить в библиотеках». Иммунолог Нильс Жерн назвал свою нобелевскую лекцию «Генеративная грамматика иммунной системы».
Большинство сложных систем, которые мы наблюдаем в мире, напротив, являются контаминирующими системами, как, например, геология, смешение красок, кулинария, звук, свет и погода. В контаминирующей системе свойства комбинации находятся среди свойств ее элементов, а свойства элементов теряются в общей массе соединения. Например, смешение красной и белой краски дает розовую краску. Таким образом, область свойств, которая имеется в контаминирующей системе, очень ограничена, и единственный способ обнаружить различия между большим числом комбинаций — это выделять все более и более тонкие отличия. Может и не быть совпадением тот факт, что две системы во вселенной, наиболее впечатляющие нас неограниченностью своего сложного строения — жизнь и сознание — имеют в основе дискретные комбинаторные системы. Многие биологи уверены, что если бы наследственность не выражалась в дискретных элементах, то эволюция (такая, какова она в нашем понимании) не была бы возможна.
Таким образом, принцип работы языка таков, что в мозгу каждого человека содержится набор слов и понятий, которые эти слова выражают (ментальный словарь), а также набор правил, по которым слова сочетаются, чтобы передать отношения между понятиями (ментальная грамматика). Мир слов мы рассмотрим в следующей главе, эта посвящена строению грамматики.
Тот факт, что грамматика — это дискретная комбинаторная система, имеет два важных следствия. Первое — это абсолютная бескрайность языка. Пойдите в Библиотеку Конгресса и выберите наугад предложение из любого тома — существует очень большая вероятность того, что вы не сможете найти его точное повторение, как бы долго вы ни искали. При попытке представить, сколько предложений способен продуцировать обычный человек, захватывает дух. Если перебить говорящего в любой случайной точке произносимого предложения, существует в среднем около десяти различных слов, которыми можно было бы продолжить предложение с данного места, так чтобы предложение было грамматически правильным и имело смысл. (В некоторых точках предложения оно может быть продолжено только одним словом, в других — существует выбор из тысяч; десять — среднее значение.) Давайте примем как факт, способность человека продуцировать предложение длиной до двадцати слов. Таким образом количество предложений, которые доступны говорящему, в принципе, может равняться 1020 (единице с двадцатью нулями или ста миллионам триллионов). При скорости пять секунд на предложение человеку понадобилось бы детство в примерно сто триллионов лет (исключая время на еду и сон), чтобы все их запомнить. На самом деле, ограничение в двадцать слов слишком строгое. Следующее вполне доступное пониманию предложение, принадлежащее Бернарду Шоу, содержит 110 слов (в его английском варианте — Перев.):
Stranger still, though Jacques-Dalcroze, like all these great teachers, is the completes of tyrants, knowing what is right and that he must and will have the lesson just so or else break his heart (not somebody else’s, observe), yet his school is so fascinating that every woman who sees it exclaims: «Oh why was I not taught like this!» and elderly gentlemen excitedly enroll themselves as students and distract classes of infants by their desperate endeavours to beat two in a bar with one hand and three with the other, and start off on earnest walks around the room, taking two steps backward whenever M. Dalcroze calls out «Hop!»
Все же, незнакомец, думал Жак Далькроз, как и все великие учителя, является совершеннейшим тираном, знающим, в чем заключается истина и что он должен и будет вести занятия именно таким способом, а иначе его сердце разорвется (его, а не чье-нибудь, заметьте); и в то же время его школа так восхитительна, что любая женщина, которая видит ее, восклицает: «Ах, почему меня не учили так же!», а пожилые господа возбужденно записываются в ученики, и развлекают классы, состоящие из детей, своими отчаянными стараниями отбивать двойной такт одной рукой и тройной — другой, и со всей серьезностью делают круги по залу, отступая на два шага назад, когда месье Далькроз командует: «Хоп!»
Действительно, если оставить в стороне тот факт, что нам отпущено около семидесяти лет жизни, каждый из нас способен произнести неограниченное количество различных предложений. Используя ту же логику, которая показывает, что существует неограниченное количество целых чисел (если вы думаете, что знаете самое большое целое число, просто прибавьте к нему единицу, и вы получите другое) должно существовать неограниченное количество предложений. В «Книге рекордов Гиннесса» было заявлено, что самым длинным предложением на английском языке является цепочка протяженностью в 1300 слов из романа Уильяма Фолкнера «Авессалом, Авессалом!», которая начинается так:
They both bore it as though in deliberate flagellant exaltation… ‘Оба они выдержали это, словно придя в нарочитую экзальтацию самобичевания…’
Я намерен обрести бессмертие, предоставив следующий побивающий рекорды результат:
Фолкнер писал: They both bore it as though in deliberate flagellant exaltation… ‘Оба они выдержали это, словно придя в нарочитую экзальтацию самобичевания…’
Но, вероятно, славы мне хватит лишь на пятнадцать минут, упомянутые в известном высказывании[32], потому что скоро мой результат будет превзойден:
Пинкер написал, что Фолкнер писал: «Оба они выдержали это, словно придя в нарочитую экзальтацию самобичевания…»
Но и этот рекорд будет побит, как только кто-нибудь предложит следующее:
Кого волнует, что Пинкер написал, что Фолкнер писал: «Оба они выдержали это, словно придя в нарочитую экзальтацию самобичевания…»
И так далее до бесконечности. Бесконечное использование конечных средств отличает человеческий мозг практически от всех искусственных механизмов продуцирования речи, с которыми мы встречаемся в повседневности, как то: говорящие куклы, машины, которые просят вас закрывать двери, и жизнерадостные инструкции голосовой почты («Нажмите „ОК“ для дальнейшего выбора»), все из которых используют ограниченный набор заранее составленных предложений.
Второе следствие такой организации грамматики — в том, что грамматика является кодом, не зависимым от сознания. Грамматика указывает, как должны сочетаться слова для передачи значений; это указание не зависит от конкретных значений, которые мы обычно передаем или ожидаем получить от других. Благодаря этому все мы чувствуем, что некоторые цепочки слов, которым можно дать осмысленное толкование, не соответствуют грамматическому коду английского языка. Ниже приводятся некоторые цепочки слов, которые мы легко можем истолковать, но которые, как мы чувствуем, неправильно образованы:
Welcome to Chinese Restaurant. Please try your Nice Chinese Food with Chopsticks: the traditional and typical of Chinese glorious history and cultural ‘Добро пожаловать в Китайский Ресторан. Мы приглашаем вас отведать замечательную китайскую еду с помощью палочек — традиционных и типичных для славной китайской истории и культурной’.
It’s a flying finches, they are ‘Это летящие зяблики они’.
The child seems sleeping ‘Ребенок, кажется, спящий’.
Is raining ‘Дождит’.
Sally poured the glass with water ‘Салли налила стакан с водой’.
Who did a book about impress you? ‘Про кого тебя впечатлила книга?’
Skid crash hospital ‘Больница автокатастроф’.
Drum vapor worker cigarette flick boom ‘Сигарета, брошенная рабочим — причина взрыв’.
This sentence no verb ‘Это предложение — нет глагол’.
This sentence has contains two verbs ‘В этом предложении есть содержится два глагола’.
This sentence has cabbage six words ‘В этом предложении есть шесть капуста слов’.
This is not a complete. This either ‘Это не закончено. Это — тоже не’.
Эти предложения «грамматически неправильные» не в том смысле, что это разорванные инфинитивные конструкции[33], обособленные причастные обороты и прочие ужасы, обитающие в классной комнате, но в том смысле, что у любого среднего говорящего на языке подсознательно возникает чувство, что с этими предложениями что-то не так, несмотря на возможность истолкования. Грамматическая неправильность — это просто следствие того, что у нас имеется встроенный код для толкования предложений. Некоторые цепочки слов поддаются пониманию, но у нас отсутствует твердая уверенность, что говорящий использовал для продуцирования этих предложений тот же самый код, что мы используем для их толкования. По той же самой причине компьютеры, менее, чем слушатели, склонные прощать грамматическую некорректность данных при вводе, выражают свое неудовольствие в слишком хорошо всем знакомых диалогах, как то:
>РАСПЕЧАТАТЬ (x + 1
*****СИНТАКСИЧЕСКАЯ ОШИБКА*****
Может иметь место и противоположное явление. Предложение может быть бессмысленным, но все же расцениваться как грамматически правильное. Классический пример приведен Хомским[34], это его единственное высказывание, попавшее в «Словарь всем знакомых цитат Барлетта» (Bartlett’s Familiar Quotations):
Colorless green ideas sleep furiously ‘Бесцветные зеленые мысли спят яростно’.
Это предложение было изобретено для того, чтобы показать, что синтаксис и смысл могут быть независимы друг от друга, но то же самое было доказано задолго до Хомского — на этом построен весь жанр бессмыслицы в поэзии и прозе, популярный в XIX веке. Вот пример из стихотворения Эдварда Лира — признанного мастера бессмыслицы:
It’s a fact the whole world knows
That Pobbles are happier without their toes.
Известно всем и каждому вокруг,
Что побблам жить удобнее без рук.
Марк Твен однажды спародировал романтическое описание природы, сделанное скорее ради сладкозвучия, чем ради содержания:
Стояло хрустящее и ядреное утро раннего октября. Ветви сирени и «золотого дождя», зажженные факелами осени, висели горящие и пылающие в высоком воздухе — сказочный мост, созданный добросердечной Природой для бескрылых диких созданий, живущих на вершинах деревьев и навещающих друг друга взаимно; лиственницы и гранаты простирали свои пурпурные и желтые языки пламени подобно ярчайшим и обширнейшим всплескам краски вдоль покатого изгиба лесного массива; чувственное благоухание бесчисленных листопадных цветов поднималось в доводящий до обморока воздух; высоко в открытом небе одинокий эсофагус[35] спал на недвижном крыле; все было преисполнено покоя, торжественности и Божьего мира.
И почти что каждому знакомо стихотворение из «Алисы в Зазеркалье» Льюиса Кэрролла, которое заканчивается так:
Он стал под дерево и ждет,
И вдруг граахнул гром —
Летит ужасный Бармаглот
И пылкает огнем!
Раз-два, раз-два! Горит трава,
Взы-взы — стрижает меч,
Ува! Ува! И голова
Барабардает с плеч.
О светозарный мальчик мой!
Ты победил в бою!
О храброславленный герой,
Хвалу тебе пою!
Варкалось. Хливкие шорьки
Пырялись по наве.
И хрюкотали зелюки,
Как мюмзики в мове.
Перевод Д. Г. Орловской
Как сказала Алиса: «Каким-то образом от этого у меня в голове появляются мысли, только я не знаю точно, какие!» И хотя здравый смысл и знание действительности, никак не способствуют пониманию этого отрывка, носители английского языка признают, что он грамматически правилен, а ментальные правила англоговорящих позволяют им вычленить точный, хотя и абстрактный, костяк смысла. Алиса сделала следующее заключение: «Кто-то кого-то здесь убил — по крайней мере это ясно…» А прочитав цитату Хомского в словаре Барлетта любой может ответить на вопросы типа: «Кто спал? Как? Спал кто-то один или их было несколько? Что это были за мысли?»
* * *
Каковы же могут быть принципы работы комбинаторной грамматики, лежащей в основе механизмов работы человеческого языка? Самый легкодостижимый способ расставлять слова в неком порядке описан в романе Майкла Фрейна «Человек-жестянка». Главный герой по фамилии Голдвассер — инженер, работающий в научно-исследовательском институте проблем автоматизации. Он должен сконструировать компьютерную систему, которая будет выдавать стандартные истории, которые встречаются в ежедневных газетах, типа «Парализованная девушка собирается снова танцевать». В нижеприведенном отрывке он проводит ручное тестирование алгоритма, который будет составлять истории о событиях в королевской семье:
Он выдвинул ящик картотеки и выбрал первую карточку из набора. На ней было написано: традиционно. Теперь ему предстояло наугад выбрать одну из карточек, на которых значилось: коронации, помолвки, похороны, свадьбы, достижение совершеннолетия, рождения, смерти и первые причастия. За день до этого он выбрал похороны, и получил указание следовать к карточке, на которой с гениальной простотой было написано: поводы для скорби. В этот день он закрыл глаза, вытащил свадьбы и получил указание следовать к карточке: поводы для ликования.
За этим логически последовала карточка с надписью: свадьба X и Y, которая привела его к выбору между: не является исключением и знаменательное событие. В любом случае за этим следовало: и действительно. И действительно, как видел сейчас Голдвассер с чувством огромного математического удовольствия, откуда ни начать — с коронаций ли, со смертей или с рождений — все пути вливались в одно элегантное русло. Он повременил на слове и действительно, а потом в быстрой последовательности вытянул: исключительно радостное событие, редко когда и возможно ли представить себе столь же популярную молодую чету.
Из следующей выборки Голдвассер вытянул: в сердцах наших людей для X отведено особое место, что заставило его проследовать к: уже очевидно, что британский народ проникся к Y глубоким расположением.
Голдвассер был удивлен и слегка озадачен тем, что ему еще не встретилось слово «важность». Но он вытащил его со следующей карточкой: особенную важность представляет то, что.
Это выводило его на: жених / невеста, а дальше предоставлялся выбор между: принадлежит к такому древнему и прославленному роду, во времена демократизации общества не является аристократом, сын / дочь того народа, с которым у нашей страны давно уже сложились теплые дружественные отношения, и сын / дочь того народа, с которым у нашей страны отношения не всегда складывались безоблачно.
Чувствуя, что в прошлый раз ему очень удачно встретилось слово «важный», на этот раз Голдвассер вытащил его намеренно. Также важно — значилось на карточке, после чего быстро последовало: помнить о том, что и X и Y — не просто символы, а молодой человек в расцвете сил и юная женщина в расцвете красоты.
Голдвассер закрыл глаза, чтобы вытянуть следующую карточку. На ней значилось: в наши дни, когда. Он призадумался над выбором из: стало модно насмехаться над традиционными моральными и семейными ценностями и уже не модно насмехаться над традиционными моральными и семейными ценностями. Он решил, что последнее высказывание тоньше соответствует вычурной прелести предмета речи.
Давайте назовем это «генератор цепочек слов» (технический термин — «модель языка с конечным числом состояний», или «модель Маркова»). Генератор цепочек слов — это комплект из списков слов или заготовок для предложений и набор указаний для следования от списка к списку. Генератор строит предложение, выбирая слово из одного списка, затем — из другого и так далее. (Чтобы узнать сказанное кем-то предложение, нужно просто просмотреть одно за другим слова в каждом списке.) Системы для составления цепочек слов часто используются в сатирах типа упомянутого романа Фрейна, как рецепты типа «сделай сам» для сочинения подобных образцов словоблудия. Например, вот Генератор Общественнонаучного жаргона, которым читатель может воспользоваться следующим образом: выбрать наугад слово из первой колонки, затем — слово из второй, затем — из третьей и выстроить их друг за другом для создания весомо звучащего термина, например: inductive aggregating interdependence ‘индуктивная дополняющая взаимозависимость’.
диалектический — совместный — взаимозависимость
обессмысленный — дегенеративный — рассеивание
позитивистский — совокупный — периодичность
предикативный — носящий характер присвоения — синтез
многосторонний — симулированный — достаточность
количественный — однородный — равноценность
дивергентный — преобразующий — ожидаемость
синхронный — варьирующий — пластичность
дифференцированный — объединенный — эпигенез
индуктивный — прогрессивный — конструктивизм
объединенный — дополнительный — деформация
дистрибутивный — выделительный — отверделость
Недавно я видел генератор цепочек слов, который составляет захватывающие аннотации на книжных обложках, и другой такой прибор, составляющий тексты песен Боба Дилана.
Генератор цепочек слов — это простейший образчик дискретной комбинаторной системы, поскольку он способен создать неограниченное количество различных комбинаций из ограниченного количества элементов. Невзирая на пародии, генератор цепочек слов способен составить неограниченное количество наборов грамматически правильных английских предложений. Например, донельзя простая схема
позволяет составить много предложений, таких как: A girl eats ice-cream ‘Какая-то девочка ест мороженое’ или The happy dog eats candy ‘Эта радостная собака ест конфеты’. Эта схема позволяет составить неограниченное количество предложений благодаря петле наверху, которая может направить генератор от списка, представленного словом happy ‘радостный’, снова к этому же списку любое количество раз: The happy dog eats ice-cream ‘Эта радостная собака ест мороженое’, The happy happy dog eats ice-cream ‘Эта радостная радостная собака ест мороженое’, и т.д.
Когда инженеру требуется придумать систему для сочетания слов в определенном порядке, генератор цепочек слов — это первое решение, которое приходит в голову. Запись голоса, сообщающего вам телефонный номер, когда вы звоните в справочную — хороший тому пример. Там имеется запись произнесенных человеком десяти цифр, каждая из которых записана в семи различных интонационных моделях (одна соответствует первой цифре номера, одна — второй и т.д.). Имея всего семьдесят этих записей можно составить десять миллионов телефонных номеров; имея еще тридцать записей для трехзначных кодов областей, возможно составление десяти миллиардов номеров (на практике многие из них никогда не используются из-за налагаемых ограничений, например — на присутствие 0 или 1 в начале телефонного номера). В действительности, были сделаны серьезные попытки представить английский язык как одну большую цепочку слов. Чтобы сделать это по возможности реалистичным, переходы от одного списка слов к другому должны отражать действительную вероятность того, что такие типы слов могут следовать друг за другом в английском языке (например, существует бо?льшая вероятность того, что за словом that ‘это’ последует is ‘есть’, а не indicates ‘указывает’). Были составлены колоссальные базы данных этих «вероятностей последующего слова»; это делалось путем компьютерного анализа корпуса текстов на английском языке или опроса добровольцев, которым предлагалось назвать первые слова, пришедшие в голову после того, как они услышат данное слово или ряды слов. Некоторые психологи предполагали, что человеческий язык основан на громадной цепи слов, хранящейся в мозгу. Эта идея созвучна теориям реакции на раздражение: некое раздражение вызывает в качестве реакции произносимое слово, затем говорящий получает вызванную им самим реакцию, которая служит как дальнейший раздражитель, вызывая одно из нескольких слов в качестве очередной реакции и т.д.
Но вызывает подозрения тот факт, что генератор цепочки слов кажется прямо-таки созданным для пародирования, как, например, в романе Фрейна. Суть этих разнообразных пародий в том, что литературный жанр, являющийся объектом иронии, настолько бессмыслен и заезжен, что простой механический метод позволяет наплодить неограниченное количество образчиков этого жанра, которые почти без натяжки могут сойти за истинное произведение. Юмор заключается в следующем несоответствии: по всеобщему признанию, люди (даже социологи и журналисты) не могут на самом деле быть генераторами цепочек слов; они только кажутся таковыми.
Современные грамматические исследования начались тогда, когда Хомский продемонстрировал, что генераторы цепочек слов не просто слегка подозрительны; принцип их работы в корне отличен от принципа работы человеческого языка. Они являются дискретными комбинаторными системами, но не того типа. Возникают три проблемы, каждая из которых освещает один из реальных аспектов работы языка.
Во-первых, предложение на английском языке полностью отличается от цепочки слов, соединенных вместе в соответствии с вероятностью последующего слова, характерной для английского языка. Вспомните предложение Хомского: Бесцветные зеленые мысли спят яростно. Он сочинил его, чтобы показать, что грамматически правильной может быть не только бессмыслица, но и невероятная последовательность слов. Вероятность того, что в английском тексте за словом бесцветные последует слово зеленые, естественно, равна нулю. Нулевой является и вероятность того, что за словом зеленые последует слово мысли, за словом мысли — спать, а за спать — яростно. Тем не менее, данная цепочка слов — это правильно построенное английское предложение. В противоположность этому, если действительно составлять цепочки слов, пользуясь таблицами вероятности последующего слова, получающиеся в итоге цепочки слов далеки от того, чтобы называться правильно построенными предложениями. Например, вы подбираете ряд слов, которые с наибольшей вероятностью могут последовать за каждой последовательностью из четырех слов, и используете эти подборки, чтобы слово за словом нарастить цепочку слов. При этом вы всегда смотрите на последние четыре слова, чтобы они определили следующее. Цепочка получится извращенно «английсковатой», но не английской, например: House to ask for is to earn our living by working towards a goal for his team in old New-York was a wonderful place wasn’t it even pleasant to talk about and laugh hard when he tells lies he should not tell me the reason why you are is evident ‘Дом для сдачи внаем должен зарабатывать нам на жизнь, работая над задачей, требующей коллективного решения в старом Нью-Йорке, был чудесным местом, не так ли, даже приятным для обсуждения и громкого смеха, когда он лжет, он не должен говорить мне причину, почему ты являешься очевидным’.
Несоответствие между английскими предложениями и цепочками слов на английском заставляет прийти к двум выводам. Когда люди усваивают язык, они усваивают его, запоминая не то, какое слово должно следовать за каким. Они усваивают его, запоминая, какая часть речи — существительное, глагол и т.д. следует за какой. Таким образом, мы можем признать бесцветные зеленые мысли, поскольку там точно такой же порядок существительных и прилагательных, который мы усвоили на примере более привычных предложений, например, strapless black dresses ‘декольтированные черные платья’. Второй вывод будет о том, что существительные, глаголы и прилагательные не просто механически соединены в одну длинную цепочку; для предложений существует некая всеобъемлющая схема, или план, согласно которому каждое слово занимает определенное гнездо.
Если генератор цепочек слов достаточно умно сконструирован, он может справиться с этими проблемами. Но Хомский изначально отвергал саму идею о том, что человеческий язык является цепочкой слов. Он доказал, что некоторые типы английских предложений даже в принципе не могут быть составлены генератором цепочек слов, каким бы большим он ни был, и как точно бы он ни соответствовал таблицам вероятности. Рассмотрим следующие предложения:
Either the girl eats ice-cream, or the girl eats candy ‘Или эта девочка ест мороженое, или эта девочка ест конфеты’.
If the girl eats ice-cream, then the boy eats hot dogs ‘Если эта девочка ест мороженое, то этот мальчик ест сосиски’.
На первый взгляд кажется, что уместить эти предложения в схему просто:
Но этот генератор не работает. За either ‘или’ дальше в предложении должно последовать or ‘или’; никто не говорит: Either the girl eats ice-cream, then the girl likes candy ‘Или эта девочка ест мороженое, то эта девочка любит конфеты’. Аналогично, if ‘если’ требует then ‘то’; никто не говорит: If the girl eats ice-cream, or the girl likes candy ‘Если эта девочка ест мороженое, или эта девочка любит конфеты’. Но чтобы удовлетворить потребность слова, стоящего в начале предложения, в каком-то другом слове, стоящем в конце предложения, генератор должен помнить слово, стоящее в начале, все то время, что он продуцирует все слова, расположенные между началом и концом. В этом-то и состоит проблема: генератор цепочек слов подвержен амнезии, запоминая только то, из какого списка он выбрал самое последнее слово, и не помня ничего, что этому предшествовало. К тому моменту, как он достигает списка or ‘или’ / then ‘то’, он не может вспомнить, что было сказано в начале: either ‘или’ либо if ‘если’. Имея счастливую возможность оглядеть весь пройденный путь с высоты, мы можем вспомнить, какой выбор сделал генератор на первой развилке, но сам генератор, перебегая, как муравей, от списка к списку, запоминать не способен.
Тут можно подумать, что было бы просто переделать генератор таким образом, чтобы в конце предложения ему не приходилось вспоминать, какой выбор был сделан в начале. Например, можно было бы соединить either ‘или’ с or ‘или’, а также — со всеми возможными последовательностями слов между ними в одну огромную последовательность, а if ‘если’ соединить с then ‘то’ и со всеми возможными последовательностями слов между ними в другую огромную последовательность. Потом можно было бы обратиться к третьему варианту последовательности, растягивая цепь настолько, что я вынужден поместить ее отдельно. Но кое-что в этом решении вызывает немедленное отторжение: получаются три идентичные подсистемы. Разумеется, то, что люди могут сказать между either и or, они могут сказать и между if и then, а также после or или then. Но эта возможность должна естественным образом проистекать из строения некого генератора в голове у человека, позволяющего ему говорить. Она не должна зависеть от того, станет ли конструктор генератора тщательно расписывать три идентичных набора инструкций (или, что ближе к реальности, придется ли ребенку, изучать структуру английского предложения, трижды: между if и then, между either и or, а также — после then и or).
[36]
Но Хомский продемонстрировал, что проблема лежит даже еще глубже. Каждое из данных предложений можно включить в состав любого другого, включая их самих:
If either the girl eats ice-cream or the girl eats candy, then the boy eats hot dogs ‘Если или эта девочка ест мороженое, или эта девочка ест конфеты, то этот мальчик ест сосиски’.
Either if the girl eats ice-cream then the boy eats ice-cream, or if the girl eats ice-cream then the boy eats candy ‘Или если эта девочка ест мороженое, то этот мальчик ест мороженое, или если эта девочка ест мороженое, то этот мальчик ест сосиски’.
В случае с первым предложением генератору нужно запомнить if ‘если’ и either ‘или’ так, чтобы потом их можно было продолжить словами or ‘или’ и then ‘то’, именно в такой последовательности. В случае со вторым предложением ему нужно запомнить either ‘или’ и if ‘если’ так, чтобы потом можно было продолжить предложение словами then ‘то’ и or ‘или’. И так далее. Поскольку в принципе не существует предела количеству if и either, с которых может начинаться предложение и каждому из которых требуется свой собственный порядок then и or, чтобы быть законченным, не выйдет ничего хорошего из раскладывания каждой последовательности в памяти на свои собственные цепочки списков — получится неограниченное количество цепочек, которые не поместятся в обладающем конечными ресурсами мозгу.
Этот аргумент может показаться вам слишком схоластическим. Ни один реально живущий человек никогда не начнет предложение со слов: Either either if either if if ‘Или или если или если если’, поэтому имеет ли значение то, что идеальная модель этого человека может продолжить данное предложение словами: then ‘то’… then ‘то’… or ‘или’… then ‘то’… or ‘или’… or ‘или’. Но Хомский просто действовал в русле математической эстетики, используя взаимодействие между either ‘или’ — or ‘или’ и if ‘если’ — then ‘то’ как простейший возможный пример одного из свойств языка — использовать «удаленные зависимости» между словами, появившимися в предложении ранее и позднее — чтобы на математическом уровне доказать, что генератор цепочек слов не способен работать с этими зависимостями.
На самом деле, языки изобилуют такими зависимостями, и простые смертные употребляют их постоянно при значительном расстоянии между словами, часто применяя несколько зависимостей одновременно — делая именно то, на что не способен генератор цепочек слов. Например, между грамматистами ходит старая байка о том, что предложение может заканчиваться пятью предлогами. Папаша тащится наверх в комнату сыночка, чтобы почитать ему сказку на ночь. Сыночек замечает, что у папаши за книга, и негодующе кричит: Daddy, what did you bring that book that I don’t want to be read to out of up for? ‘Папа, зачем ты принес наверх эту книгу, из которой я не хочу, чтобы мне читали?’ К моменту произнесения слова read ‘читали’, сыночек должен был задаться целью сохранить в памяти четыре зависимости: to be read ‘читали’ требует to (предлог, обозначающий направленность действия — читали кому), that book that ‘эту книгу, из которой…’ требует предлогов out of, bring ‘принес сюда’ требует up ‘наверх’, a what требует for (словосочетание what for означает ‘зачем’). Другой, еще лучший пример взят из реальной жизни (из письма в журнал «ТВ-гайд»[37]):
How Ann Salisbury can claim that Pam Dawber’s anger at not receiving her fair share of acclaim for Mork and Mindy’s success derives from a fragile ego escapes me.
‘To, как Энн Сэлисбери может заявлять, что гнев Пэм Добер, вызванный неполучением честной доли от вознаграждения за успех «Морка и Минди», происходит от уязвленного самолюбия, остается мне не понятным’.
В том месте предложения, которое начинается сразу после слова not, автор письма должен был держать в памяти четыре грамматически обязательных положения: 1) not требует -ing (her anger at not receiving acclaim ‘гнев, вызванный неполучением’) требует распространения в виде причастного оборота — гнев, вызванный; 2) at требует существительного или герундия (her anger at not receiving acclaim); 3) подлежащее в единственном числе Pam Dawber’s anger требует, чтобы глагол, стоящий четырнадцатью словами дальше, согласовывался с подлежащим в числе (Dawber’s anger… derives from ‘гнев Пэм Добер… происходит от’); 4) подлежащее в единственном числе, начинающееся с How требует от глагола, стоящего от него через двадцать семь слов согласования в числе (How… escapes me ‘То, как… остается мне непонятным’). Подобно автору, читатель должен держать все эти зависимости в памяти для того, чтобы понять предложение. Теперь, говоря технически, можно было бы соорудить модель цепочки слов, которая могла бы работать даже с такими предложениями, поскольку существует какой-то реальный лимит числа зависимостей, которые говорящему нужно держать в памяти (например, четыре). Но уровень избыточности в генераторе будет абсурдным: для каждой из тысяч комбинаций зависимостей в генераторе придется дублировать идентичную цепочку. Пытаясь поместить в памяти такую суперцепочку, можно легко сойти с ума.
* * *
Разница между искусственной комбинаторной системой, которую мы рассматриваем на примере генератора цепочек слов, и естественной системой, которую мы рассматриваем на примере человеческого мозга, обобщена в строке стихотворения Джойса Килмера: «Только Бог может создать дерево»[38]. Предложение — это дерево, а не цепочка. В грамматике человеческого языка слова сгруппированы в синтаксические группы, подобно веточкам присоединенным к ветви. Синтаксической группе присвоено имя — ментальный символ — и маленькие синтаксические группы могут быть объединены в бо?льшие. Возьмем предложение: The happy boy eats ice-cream ‘Этот радостный мальчик ест мороженое’. Оно начинается двумя словами, выступающими вместе как единое целое — это именная группа the happy boy ‘этот радостный мальчик’. В английском именная группа (NP) состоит из имени существительного (N), которому иногда предшествует артикль или «детерминатор» (сокращенно: «det») и любое количество адъективных слов (А). Все это можно обобщить в правиле, которое определяет как выглядят английские именные группы вообще. В стандартном лингвистическом обозначении стрелка означает: «состоит из», скобки означают: «присутствующий факультативно», а звездочка обозначает: «любое желаемое количество этих элементов», но я привожу это правило только для того, чтобы показать, что вся заключенная в нем информация может быть ясно выражена в нескольких символах; можно не обращать внимание на обозначения, а смотреть только на перевод, обычными словами приведенный ниже:
NP —> (det) A* N
«Именная группа состоит из присутствующего факультативно детерминатора, за которым следует любое количество адъективных слов, за которыми следует существительное».
Это правило определяет строение перевернутой вверх ногами ветви дерева:
А вот — два других правила, одно из которых дает определение английскому предложению (S), а другое дает определение предикативной или глагольной группе (VP), оба они используют как составную часть символ NP:
S —> NP VP
«Предложение состоит из именной группы, за которой следует глагольная группа»
VP —> V NP
«Глагольная группа состоит из глагола, за которым следует именная группа».
Теперь нам потребуется ментальный словарь, который бы уточнил, какое слово принадлежит к какой части речи (имя существительное, глагол, прилагательное, предлог, детерминатор):
N —> boy ‘мальчик’, girl ‘девочка’, dog ‘собака’, cat ‘кошка’, ice-cream ‘мороженое’, candy ‘конфеты’, hot dogs ‘сосиски’
«Существительные могут быть извлечены из следующего списка: boy ‘мальчик’, girl ‘девочка’…»
V —> eats ‘ест’, likes ‘любит’, bites ‘кусается’
«Глаголы могут быть извлечены из следующего списка: eats ‘ест’, likes ‘любит’, bites ‘кусается’»
А —> happy ‘радостный’, lucky ‘счастливый’, tall ‘высокий’
«Адъективные слова могут быть извлечены из следующего списка: happy ‘радостный’, lucky ‘счастливый’, tall ‘высокий’»
det —> a, the, one
«Детерминаторы могут быть извлечены из следующего списка: a, the, one»
Набор правил, подобных тем, которые я привел — «грамматика непосредственно составляющих» — задает предложение, нагружая словами ветви на растущем сверху вниз дереве:
Та невидимая сверхструктура, что удерживает слова на месте, — это могущественное изобретение, устраняющее проблемы, которые были у генераторов цепочек слов. Основная суть древесного представления в том, что дерево модулярно, как и гнездо телефонного коммутатора, или муфта садового шланга. Символ типа «NP» подобен разъему или креплению определенной формы. Он позволяет одному компоненту (синтаксической группе) заскочить в любую из нескольких позиций внутри других компонентов (бо?льших синтаксических групп). Как только тип синтаксической группы задан правилом и ему присвоен свой символ-соединитель, ему никогда более не нужно быть определенным снова, синтаксическая группа может быть подключена в любом месте, где есть соответствующая розетка. Например, в той маленькой грамматике, которую я продемонстрировал, символ «NP» используется и как подлежащее в предложении (S —> NP VP), и как дополнение в глагольной группе (VP —> V NP). В более приближенной к жизни грамматике он также будет использоваться как объект, на который направлено действие предлога near the boy ‘рядом с мальчиком’, в конструкции со значением принадлежности the boy’s hat ‘шапка радостного мальчика’, как косвенное дополнение give the boy a cookie ‘дай печенье мальчику’ и в нескольких других позициях. Такая организация вида «вилка-розетка» объясняет, как люди могут использовать одну и ту же синтаксическую группу во многих разных позициях в предложении, включая:
[The happy happy boy] eats ice-cream ‘[Этот радостный-радостный мальчик] ест мороженое’.
I like [the happy happy boy] ‘Я люблю [этого радостного-радостного мальчика]’.
I gave [the happy happy boy] a cookie ‘Я дал [этому радостному-радостному мальчику] печенье’.
[The happy happy boy]’s cat eats ice-cream ‘Кошка [этого радостного-радостного мальчика] ест мороженое’.
Нет необходимости выучивать, что прилагательное скорее предшествует существительному (чем наоборот) в позиции подлежащего, затем выучивать то же самое для позиции прямого дополнения, косвенного дополнения и наконец — для позиции обладателя.
Заметьте также, что возможность разнородного соединения любой синтаксической группы с любым гнездом делает грамматику независимой от того, что подсказывает нам здравый смысл, задаваемый значениями слов. Этим объясняется, почему мы можем писать и признавать грамматически правильную бессмыслицу. Наша маленькая грамматика допускает существование всех видов бесцветных зеленых предложений, как например: The happy happy candy likes the tall ice-cream ‘Эти радостные-радостные конфеты любят это высокое мороженое’, одновременно сообщая такие неизвестные доселе факты, как: The girl bites the dog ‘Эта девочка кусает эту собаку’.
Любопытнее всего, что ветви синтаксического дерева с метками действуют в роли всеобъемлющей памяти или плана для всего предложения. Это позволяет без затруднений справляться с находящимися в гнездах удаленными зависимостями типа: if… then ‘если… то’ и either… or ‘или… или’. Все, что при этом требуется — это правило, которое задает синтаксическую группу, содержащую копию точно такого же вида синтаксической группы, например:
S —> either S or S
«Предложение может состоять из слова either ‘или’, за которым следует предложение, за которым следует слово or ‘или’, за которым следует другое предложение».
S —> if S then S
«Предложение может состоять из слова if ‘если’, за которым следует предложение, за которым следует слово then ‘то’, за которым следует другое предложение».
Эти правила включают один представитель некоторого символа внутрь другого представителя того же самого символа (в данном случае — предложение внутрь предложения); это удобный способ (называющийся в логике «рекурсией») создавать бесконечное количество структур. Части большего предложения упорядоченно соединены вместе как группа ветвей, произрастающих из одного узла. Этот узел удерживает вместе каждое if ‘если’ с каждым его then ‘то’ и каждое either ‘или’ с его or ‘или’, как на следующей диаграмме (треугольники использованы как сокращения для большого количества мелких веточек, которые только усложнили бы дело, если бы мы показали их все):
Есть еще один повод поверить в то, что предложение удерживается вместе с помощью ментального дерева. До сих пор я говорил о соединении слов в грамматически правильном порядке вне зависимости от их значения. Но объединение слов в синтаксические группы также необходимо для того, чтобы связать грамматически правильные предложения с их истинным значением — блоками мыслекода. Мы знаем, что приведенное выше предложение рассказывает о девочке, а не о мальчике, который ест мороженое, и о мальчике, а не о девочке, которая ест сосиски; и мы знаем, что еда мальчика является зависимой от того, что ест девочка, а не наоборот. Это происходит потому, что слова девочка и мороженое связаны внутри своей собственной группы аналогично тому, как связаны мальчик и сосиски и два предложения, в которых речь идет о девочке. Для генератора цепочек слов это просто одно несчастное слово, идущее после другого, но для грамматики непосредственно составляющих то, как слова соединены в дереве, отражает соотношение мыслей в мыслекоде. Таким образом, структура составляющих — это одно из решений технической проблемы: как взять взаимосвязанную паутину мыслей в сознании и закодировать их в виде цепочки слов, которые нужно произносить губами одно за другим.