Глава 2. ДНК
Глава 2. ДНК
На стене паба “Орел” в Кембридже висит синяя мемориальная доска, установленная в 2003 году в честь пятидесятилетия одного случая, когда разговоры в этом пабе приняли не совсем обычный оборот. Во время обеда 28 февраля 1953 года два завсегдатая “Орла”, Джеймс Уотсон и Фрэнсис Крик, пришли туда и объявили, что раскрыли тайну жизни. Хотя этот эмоциональный американец и этот разговорчивый британец, отличавшийся малоприятным смехом, временами, должно быть, и напоминали дуэт комиков, на сей раз они были абсолютно серьезны — и наполовину правы. Если считать, что у жизни есть тайна, то эту тайну, несомненно, составляет именно ДНК. Впрочем, Крик и Уотсон, при всех их незаурядных способностях, раскрыли тогда лишь половину этой тайны.
В то утро они разгадали структуру ДНК — двойную спираль. Полученная ими схема стала результатом вдохновенного интеллектуального прорыва, обеспеченного гениальностью, умением строить модели, знанием химии и несколькими позаимствованными без спроса рентгенограммами, и была, по словам Уотсона, “слишком хороша, чтобы быть неправдой”. И чем больше они говорили о ней в тот обеденный перерыв, тем больше убеждались в ее правильности. Она была опубликована в номере журнала “Нейчур” от 25 апреля в письме, которое заняло всего одну страницу и немного напоминало заметку о появлении новорожденного в малотиражной местной газете. Необычайно скромная по тону (Уотсон писал в своей знаменитой книге, что “никогда не видел, чтобы Фрэнсис Крик держался скромно”, да и сам он был не намного скромнее своего партнера), та заметка завершалась намеренно уклончивым утверждением: “От нашего внимания не ускользнуло, что постулированное нами специфическое образование пар заставляет сразу предположить возможный механизм копирования генетического материала”.
ДНК, как известно, составляет основу наших генов, наследственный материал клеток. В ней зашифрованы свойства людей и амеб, грибов и бактерий — всех форм жизни на нашей планете, за исключением некоторых вирусов. Двойная спираль ДНК, в которой две цепочки без конца вьются друг вокруг друга оборот за оборотом, — поистине культовый научный символ. Уотсон и Крик показали, как одна цепочка дополняет другую на молекулярном уровне. Если оторвать их друг от друга, каждая из них может служить матрицей для воссоздания другой, так что из одной спирали получатся две точно таких же. Всякий раз, когда тот или иной организм размножается, он передает копии своей ДНК потомкам. Все, что для этого нужно, — это разделить цепочки и синтезировать две идентичных копии оригинала.
Хотя подробное описание молекулярного механизма этого процесса могло бы вызвать у любого читателя головную боль, лежащий в основе механизма принцип изумительно, потрясающе прост. Генетический код представляет собой последовательность “букв” (их более строгое наименование — “азотистые основания”). Таких букв в ДНК-алфавите всего четыре: А, Т, Г и Ц. Их полные названия — аденин, тимин, гуанин и цитозин, но эти химические термины для нас здесь не важны. Важно то, что в связи с ограничениями, накладываемыми формой молекул ДНК и структурой связей в них, А может образовывать пару только с Т, а Ц — только с Г. Если оторвать цепочки двойной спирали одну от другой, на каждой из них будут рядком торчать неспаренные буквы. С каждой буквой А может связаться только Т, а с каждой буквой Ц — только Г, и так далее. Азотистые основания не только дополняют друг друга, но и испытывают настоящую потребность найти себе пару. Только одно может сделать тусклую химическую жизнь буквы Т светлее — постоянная близость с буквой А. Стоит их совместить, и все их связи запоют в чудесной гармонии. Это химическое явление — настоящий “основной инстинкт”, неотъемлемое свойство азотистых оснований. Оно делает из цепочек ДНК нечто большее, чем пассивные матрицы: каждое основание обладает своего рода магнетизмом, притяжением к своему “альтер эго”. Стоит разделить цепочки, и они самопроизвольно сольются снова или, если им помешать, смогут послужить матрицами, обладающими неодолимой тягой к соединению с другой “второй половиной”, неотличимой от прежней.
Схема соединения азотистых оснований ДНК. Геометрическими особенностями “букв" определяется, что Г связывается только с Ц, а А — только с Т.
Последовательность букв ДНК кажется нескончаемой. Например, в человеческом геноме почти три миллиарда пар азотистых оснований (на научном языке — три гигабазы). Это значит, что если взять по одной из всех хромосом, имеющихся в ядре нашей клетки, общее число букв в них составит почти три миллиарда. Если опубликовать последовательность человеческого генома в виде книг, она заполнит примерно двести томов размером с солидный телефонный справочник. А ведь наш геном — еще далеко не самый большой. Как ни странно, рекордсменом по этому показателю является ничтожная амеба Amoeba dubia, гигантский геном которой содержит 670 гигабаз — примерно в 220 раз больше, чем в нашем геноме. По большей части он, судя по всему, состоит из “мусора” — ДНК-последовательностей, которые вообще ничего не кодируют.
Каждому делению клетки предшествует удвоение (репликация) всей ее ДНК — процесс, занимающий не один час. Человеческое тело состоит из чудовищного количества клеток — пятнадцати миллионов миллионов, и в каждой из них содержится собственная высококачественная копия (на самом деле — даже две копии) одних и тех же молекул ДНК. Чтобы организм каждого из нас развился из единственной оплодотворенной яйцеклетки, двойным спиралям нашей ДНК пришлось разделяться и служить матрицами для достраивания новых цепочек пятнадцать миллионов миллионов раз (и даже гораздо больше, потому что наши клетки все время умирают и замещаются новыми). Точность копирования каждой буквы фантастична: ошибки в их порядке встречаются с частотой всего в один случай на миллиард букв. Для сравнения: переписчику книг, чтобы работать со сходной точностью, понадобилось бы 280 раз переписать всю Библию от начала до конца, прежде чем сделать единственную ошибку. На деле переписчики справлялись со своей работой далеко не столь успешно. Утверждается, что до нашего времени дошло около 24 тысяч рукописных экземпляров Нового Завета, и среди них нет двух одинаковых.
И все же ошибки накапливаются и в ДНК — хотя бы потому, что геном так огромен. Ошибки, при которых одна буква случайно заменяется другой, называют точечными мутациями. Перед каждым делением человеческой клетки можно ожидать появления в каждом наборе хромосом примерно трех подобных мутаций. И чем дольше клетка делится, тем больше в ней накапливается мутаций (это может приводить к развитию болезней, например рака). Мутации могут также передаваться из поколения в поколение. Если из оплодотворенной яйцеклетки развивается женский зародыш, то яйцеклетки нового организма образуются после примерно тридцати циклов деления, и в ходе каждого цикла добавляются новые мутации. У мужского организма дела обстоят еще хуже: для образования сперматозоидов требуется около ста циклов деления, каждый из которых неизбежно вносит свою лепту в груз мутаций. Поскольку производство сперматозоидов продолжается на протяжении всей жизни и включает все больше и больше клеточных циклов, то чем старше мужчина, тем больше мутаций накапливается в его половых клетках. Генетик Джеймс Кроу сформулировал эту закономерность так: наибольшая мутационная угроза здоровью человеческих популяций исходит от плодовитых стариков. Но даже у среднего ребенка молодых родителей имеется около двухсот новых мутаций, которые у них самих отсутствовали (хотя лишь немногие из этих мутаций могут оказаться вредными)1.
Поэтому, несмотря на необычайную точность копирования ДНК, ее молекулы все-таки меняются. Каждое поколение отличается от предыдущего — не только оттого, что в результате полового процесса гены перемешиваются, но также оттого, что каждый из нас становится носителем новых мутаций. Многие из них представляют собой точечные мутации, о которых мы говорили выше (изменения единственной буквы ДНК), другие бывают намного радикальнее. Порой целые хромосомы лишний раз удваиваются или не могут разойтись при делении клетки, длиннейшие куски ДНК удаляются, вирусы встраивают в хромосомы свою ДНК, а фрагменты хромосом переворачиваются так, что последовательность букв меняется на противоположную. Возможностей таких изменений бесконечно много, хотя наиболее серьезные из них обычно несовместимы с жизнью. Если рассмотреть наш геном на этом уровне, он окажется похожим на яму, кишащую змеями, где змееподобные хромосомы без устали сливаются и разделяются. Роль стабилизирующей силы здесь играет естественный отбор, отсеивающий рождающихся монстров, кроме самых безобидных. ДНК причудливо извивается и меняется, но отбор ее выпрямляет и исправляет. Любые полезные изменения сохраняются, а любые серьезные ошибки или особо вредные изменения приводят к выкидышу — в буквальном смысле. Из вредных мутаций сразу не отсеиваются лишь не столь серьезные, которые могут быть связаны с болезнями, проявляющимися на более поздних этапах жизни.
Меняющиеся последовательности букв в ДНК стоят почти за всем, что можно прочитать в газетах о наших генах. Например, ДНК-дактилоскопия (которую используют для установления отцовства, импичмента президентов, а также уличения преступников — иногда спустя десятки лет после события преступления) основана на различиях в последовательностях ДНК-букв между индивидуумами. Человеческие геномы различаются столь заметно, что ДНК каждого из нас свойственны собственные уникальные “отпечатки”. Степень нашей подверженности многим болезням тоже зависит от крошечных различий в ДНК-последовательностях. В среднем люди отличаются друг от друга примерно одной на каждую тысячу букв, так что разница между двумя человеческими геномами составляет 6-ю миллионов однобуквенных отличий — так называемых “снипов” (SNPs, от single nucleotide polymorphisms — однонуклеотидные полиморфизмы). Существование снипов означает, что у всех нас имеются немного разные варианты большинства генов. Хотя большинство снипов почти точно не имеют для нас никаких последствий, некоторые из них связаны с недугами, такими как диабет или болезнь Альцгеймера (однако как они действуют, нам еще не всегда известно).
При всех этих различиях мы все-таки можем пользоваться понятием “человеческий геном”: несмотря на все снипы, 999 букв из каждой тысячи у всех нас все-таки совпадают. На то есть две причины: время и отбор. В эволюционных масштабах не так уж много времени прошло с тех пор, как мы были обезьянами. Более того, зоолог стал бы уверять вас, что мы по-прежнему обезьяны. Предки человека отделились от общего предка с шимпанзе около шести миллионов лет назад и с тех пор накапливали мутации с частотой двести мутаций за поколение. Этого времени хватило лишь на то, чтобы изменить около 1 % нашего генома. При этом предки шимпанзе эволюционировали со сходной скоростью, и теоретически мы могли бы ожидать разницы в 2 %. Но на деле разница несколько меньше: ДНК-последовательности людей и шимпанзе идентичны на 98,6 %2. Это связано с постоянным торможением изменений, которое обеспечивает естественный отбор, выбраковывая большинство вредных мутаций. Ясно, что когда многие изменения выбраковываются отбором, оставшиеся будут больше похожи друг на друга, чем были бы, если бы их ничто не сдерживало.
Если углубиться еще дальше в прошлое, мы увидим, как эти две силы, время и отбор, действуя вместе, сплели великолепнейший, изысканнейший ковер. Все живое на нашей планете состоит в родстве, и, читая буквы ДНК, можно выяснить, в каком. Сравнивая ДНК-последовательности, можно рассчитать степень нашего родства с любыми другими организмами, от обезьян до сумчатых, рептилий, амфибий, рыб, насекомых, ракообразных, червей, растений, простейших, бактерий — кого угодно. Свойства всех нас определяются последовательностями букв, которые можно точными методами сравнивать друг с другом. У всех нас даже есть общие участки последовательностей — фрагменты, изменение которых сдерживалось общими механизмами отбора, в то время как другие участки изменялись до неузнаваемости. Если прочитать ДНК-последовательность кролика, мы увидим такие же нескончаемые ряды оснований, одни участки которых будут идентичны нашим, другие — отличными от них, и все они будут перемешаны друг с другом, составляя сложный калейдоскоп. То же относится и к чертополоху: кое-где наши с ним ДНК-последовательности идентичны или похожи, но здесь несходные участки будут занимать гораздо больше места, отражая, во-первых, огромный промежуток времени, прошедшего с тех пор, когда жил наш общий предок, а во-вторых, разность образа жизни человека и чертополоха. Впрочем, глубокие основы нашей биохимии остались теми же. Мы все состоим из клеток, работающих сходным образом, и их общие свойства определяются похожими участками ДНК-последовательностей.
Учитывая эти черты глубокого биохимического сходства, можно ожидать, что у нас найдутся общие участки последовательностей даже с самыми далекими от нас формами жизни, такими как бактерии. Это действительно так. Но здесь мы сталкиваемся с источником некоторой путаницы, поскольку сходство последовательностей может оцениваться не в пределах 0-100%, а лишь от 25 до 100% (ведь ДНК-букв всего четыре). Если случайным образом заменить одну букву на одну из четырех, с вероятностью 25% новая буква будет такой же, как и старая. Точно так же, если с нуля синтезировать в лаборатории случайную ДНК-последовательность, она неизбежно будет по крайней мере на четверть сходна с любым случайно выбранным нашим геном. Поэтому соображение о том, что мы “наполовину бананы”, раз наш геном наполовину совпадает с геномом банана, мягко говоря, неверно. Исходя из той же логики, любая случайно составленная последовательность ДНК будет на четверть человеком. Не зная, что именно означают буквы той или иной последовательности, мы блуждали бы впотьмах.
Именно поэтому утром 28 февраля 1953 года Уотсон и Крик лишь наполовину разгадали загадку жизни. Им удалось разобраться в строении ДНК и понять, как каждая из двух цепочек двойной спирали служит матрицей для синтеза копии другой цепочки, обеспечивая передачу наследственного кода каждого организма. О чем они не упомянули в своей знаменитой статье (поскольку для выяснения этого потребовался еще десяток лет хитроумных исследований), — так это о том, как именно в каждой последовательности букв зашифрована наследственная информация. Хотя расшифровка генетического кода, этого шифра жизни, и не дала столь символичного и впечатляющего результата, как сама двойная спираль, ровным счетом ничего не говорящая о последовательностях записанных в ней букв, она стала, возможно, еще более крупным достижением — в тем числе Фрэнсиса Крика, сыгравшего в тех исследованиях немалую роль. Для темы этой главы особенно важно, что расшифрованный код, сначала казавшийся главным разочарованием современной биологии, сообщает нам интереснейшие сведения о становлении в ходе эволюции самой ДНК почти четыре миллиарда лет назад.
Схема двойной спирали молекулы ДНК, показывающая, как две ее цепочки закручиваются друг вокруг друга. Если разделить их, каждая цепочка сможет служить матрицей для синтеза точно такой же противоположной цепочки.
ДНК кажется чем-то столь современным, что нам сложно оценить, как мало в 1953 году было известно о началах молекулярной биологии. Образ двойной спирали разошелся по свету именно из той публикации Уотсона и Крика, иллюстрацию к которой нарисовала жена Крика Одиль (она была художницей). На ее рисунке ДНК похожа на своего рода винтовую лестницу, и именно так его и воспроизводили почти без изменений на протяжении полувека. Написанная в 60-х годах знаменитая книга Уотсона “Двойная спираль” стала, в свою очередь, классическим изображением современного взгляда на науку. Влияние этой книги было настолько велико, что сама жизнь, может быть, начала подражать искусству. Я, например, прочитав “Двойную спираль” еще в школе, и сам стал мечтать о Нобелевской премии и революционных открытиях. Думаю, мои представления о том, как занимаются наукой, в то время основывались почти исключительно на книге Уотсона, и разочарование, которое неизбежно постигло меня в университете, по всей вероятности, было связано с тем, что действительность не оправдала моих восторженных ожиданий. Я перестал искать острых ощущений в науке и занялся ради них скалолазанием. Потребовался не один год, чтобы я снова проникся чувством интеллектуального восторга от научной работы.
Но едва ли не все, чему я научился в университете, было неизвестно в 1953 году Уотсону и Крику. Давно стал общим местом тезис, что “белки закодированы в генах”. Но в начале 50-х годов даже по этому вопросу у ученых не было единого мнения. Уотсон впервые приехал в Кембридж в 1951 году, и очень скоро его стал раздражать скептицизм Макса Перуца и Джона Кендрю. По их мнению, еще нельзя было считать окончательно доказанным, что гены записаны в ДНК, а не в белках. Хотя молекулярная структура ДНК не была пока известна, ее химический состав был уже вполне ясен, и было известно, что он почти не меняется от одного вида к другому. Если гены действительно составляют основу наследственности и в них закодированы бесчисленные отличительные черты разных особей и видов, то как можно было пытаться объяснить все богатство и разнообразие жизни этим однородным соединением, по составу которого даже животные и бактерии не слишком отличаются друг от друга? Казалось, что белки с их бесконечным многообразием гораздо лучше подходят на роль носителя наследственной информации.
Уотсон был одним из тех немногих, кого убедили результаты экспериментов американского биохимика Освальда Эвери, опубликованные в 1944 году и свидетельствовавшие о том, что гены записаны в ДНК. Только энтузиазм и убежденность Уотсона побудили Крика взяться за насущную проблему разгадки структуры ДНК. Когда эта проблема была решена, ребром встал вопрос о генетическом коде. И здесь степень неосведомленности ученых того времени тоже просто удивительна для людей нового поколения. Молекулы ДНК состоят из последовательностей, составленных из всего четырех букв, расположенных на первый взгляд в случайном порядке. Было не так уж сложно догадаться, что этот порядок должен каким-то образом кодировать белки. Молекулы белков тоже состоят из последовательности “строительных блоков”, которые называют аминокислотами. Последовательностями букв в ДНК были предположительно закодированы последовательности аминокислот в белках. Но если код был универсальным для всех организмов (чего на тот момент уже можно было ожидать), то набор аминокислот, входящих в состав белков, тоже должен был оказаться универсальным. А в этом еще отнюдь не было уверенности. Саму эту возможность мало кто обсуждал, пока Уотсон и Крик за обедом все в том же “Орле” не составили канонический список двадцати аминокислот, который сейчас можно найти во всех учебниках. Любопытно, что хотя ни один из дуэта не был биохимиком, они угадали все с первого же раза.
Теперь задача сразу стала ясна. Все свелось к математической головоломке, варианты решения которой не ограничивались никакими фактами из тех, что пришлось зубрить следующим поколениям студентов, изучавших молекулярную биологию. Четыре буквы в молекулах ДНК должны были кодировать двадцать аминокислот. Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте. Дублетный код тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот (4x4 = 16). Минимальное число букв было три, то есть код мог быть триплетным (впоследствии Фрэнсис Крик и Сидней Бреннер доказали, что это именно так). Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (4x4x4 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же их было только двадцать? Секрет этого фокуса должен был объяснить смысл четырехбуквенного “алфавита”, организованного в шестьдесят четыре трехбуквенных “слова”, кодирующие двадцать аминокислот.
Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий (Джордж) Гамов, больше известный своими теориями, касающимися Большого взрыва. Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали. Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной. Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации. Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее. Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц. Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее. И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.
Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом. Но Фред Сэнгер, скромный гений, впоследствии получивший две Нобелевских премии (одну за метод прочтения последовательностей аминокислот в белках, другую — за метод прочтения букв в ДНК), занимался в то время выяснением последовательности аминокислот в молекуле инсулина. Вскоре он выяснил, что аминокислоты в белке могут располагаться в любом порядке и ограничений на их последовательности в белках в природе нет. Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота. Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.
Следующую попытку разгадать загадку кода предпринял Крик. Он высказал идею настолько красивую, что ее немедленно все приняли, хотя самого автора и смущала нехватка доказательств. Крик воспользовался новыми открытиями, сделанными в нескольких молекулярно-биологических лабораториях, в первую очередь в новой лаборатории Уотсона в Гарварде. Уотсон глубоко увлекся исследованиями РНК — более короткой одноцепочечной молекулы, близкой к ДНК и находимой как в цитоплазме клеток, так и в ядре. Кроме того, он обратил внимание на то, что РНК составляет неотъемлемую часть крошечных структур, теперь называемых рибосомами, на которых, судя по всему, и синтезировались белки. Итак, неактивная ДНК сидит в ядре. Когда нужно синтезировать какой-либо белок, соответствующий участок ДНК используется в качестве матрицы, чтобы синтезировать его РНК-копию. Она физически выходит из ядра и достигает ожидающих ее снаружи рибосом, синтезирующих этот белок, используя в качестве матрицы уже молекулу РНК. Эта разновидность РНК впоследствии получила название матричной РНК (мРНК). Уотсон еще в 1952 году писал Крику: “ДНК делает РНК делает белок”. Крика теперь интересовало вот что: как точная последовательность букв молекулы матричной РНК переводится (транслируется) в последовательность аминокислот в белке?
Крик крепко задумался. Он предположил, что матричная РНК транслируется с помощью набора особых молекул — адаптеров, по одной на каждую аминокислоту. Адаптеры тоже должны состоять из РНК, у каждого из них должен быть антикодон, способный узнавать соответствующий кодон матричной РНК и связываться с ним. Принцип этого связывания, как считал Крик, должен быть точно таким же, как в ДНК: Ц образует пару с Г, А — с Т, и так далее3. Существование адаптеров предполагалось тогда чисто гипотетически, но они действительно были открыты несколько лет спустя, и оказалось, что они действительно состоят из РНК, как и предсказывал Крик. Теперь их называют транспортными РНК (тРНК). Вырисовывалась система, напоминающая детский конструктор, детали которого соединялись друг с другом и вновь разделялись, образуя изумительные, хотя и недолговечные структуры.
Но здесь Крик пошел по ложному пути. Я пишу об этом довольно подробно потому, что хотя действительность и оказалась несколько богаче, чем он предполагал, его идеи могут по-прежнему быть актуальны для решения вопроса о том, как все это возникло. Крик представлял себе, что матричная РНК просто сидит в цитоплазме, а ее кодоны торчат, как соски свиноматки, и к каждому из них может “присосаться” транспортная РНК. Рано или поздно молекулы тРНК свяжутся с мРНК по всей длине, расположившись одна за другой, и с каждой из них будет связана, как хвост поросенка, соответствующая аминокислота, готовая соединиться с соседними аминокислотами и образовать белковую цепочку.
Проблема, по мнению Крика, состояла в том, что тРНК будут прибывать в случайном порядке, по мере их появления рядом с мРНК, и связываться с ближайшим соответствующим кодоном. Но если не начинать с начала и не заканчивать в конце, как они узнают, где начинается и где заканчивается один кодон? Как они смогут найти правильную рамку считывания? Если последовательность содержит фрагмент АТЦГТЦ, то одна тРНК может связаться с кодоном АТЦ, а другая — с кодоном ГТЦ, но что помешает соответствующей тРНК узнать кодон ЦГТ в середине этого фрагмента и тем самым транслировать совсем не то, что нужно? Предложенный Криком ответ на этот вопрос предполагал категорический запрет подобных вещей. Раз матрица в целом должна читаться однозначно, значит, не все кодоны должны иметь смысл. Какие же из них требовалось запретить? Ясно, что последовательности, состоящие только из А, только из Ц, только из Т или только из Г, должны были оказаться под запретом: в цепочке АААААА нельзя найти правильную рамку считывания. Затем Крик проверил все другие трехбуквенные комбинации. Он рассуждал примерно так: если АТЦ имеет смысл, то все циклические перестановки этих трех букв (ТЦА и ТАЦ) должны быть под запретом. Сколько возможностей это нам оставляет? Снова двадцать! (Из шестидесяти четырех возможных кодонов AAA, ТТТ, ЦЦЦ и ГГГ исключаются. Остается шестьдесят. Из каждых трех вариантов циклических перестановок допустим только один, значит, делим шестьдесят на три.)
В отличие от перекрывающихся кодов, код Крика не накладывал никаких ограничений на порядок аминокислот в белке и не предполагал, что точечная мутация будет непременно менять две или три аминокислоты. Когда была выдвинута эта гипотеза, казалось, она дает прекрасное решение проблемы рамки считывания и при этом сокращает число кодонов с шестидесяти четырех до двадцати, что соответствует числу аминокислот в белках. Эта гипотеза ничуть не противоречила всем имеющимся на тот момент данным. И все же она ошибочна. Спустя несколько лет выяснилось, что искусственно полученная РНК, состоящая из кодонов ААА (запрещенных Криком), все же кодирует аминокислоту лизин и может транслироваться в белковую цепочку, состоящую исключительно из лизина.
К середине 60-х годов, когда были усовершенствованы экспериментальные методы, нескольким исследовательским группам удалось шаг за шагом выяснить, что на самом деле представляет собой генетический код. После всех попыток расшифровать его открывшаяся картина вызывала глубочайшее разочарование. Оказалось, что никакого изящного нумерологического решения не было, а код просто вырожден (это значит, что в нем полно излишеств). Три аминокислоты кодируются шестью разными кодонами каждая, в то время как другие кодируются лишь одним или двумя. Все кодоны идут в дело: три кодона означают “стоп” (конец трансляции), а все остальные кодируют ту или иную аминокислоту. Выходило, что в генетическом коде нет никакого порядка, никакой красоты. Этот пример может служить нагляднейшим опровержением мысли, что красота может служить проводником к научной истине*1. Судя по всему, в основе кода не было и никакой структурной логики: между аминокислотами и соответствующими им кодонами не было ни особой химической, ни особой физической связи.
Крик объявил этот удручающий код “застывшей случайностью”, и большинство исследователей не могло с ним не согласиться. По мнению Крика, код застыл оттого, что любые покушения на его структуру (попытки его разморозить) имели бы слишком серьезные последствия. Единственная точечная мутация может изменить ту или иную аминокислоту, расположенную в определенном месте определенного белка, но любое изменение самого кода приводило бы к катастрофическим переменам во всех белках без исключения. Разница между этими событиями соответствовала бы разнице между случайной опечаткой в книге, не особенно меняющей ее смысл, и изменением одной буквы на другую во всем алфавите, что превращало бы весь текст в абракадабру. Поэтому, как считал Крик, после того, как код был выбит на скрижалях, любые покушения на него карались смертью. Эта точка зрения и сегодня широко распространена среди биологов.
Но предполагаемая Криком “случайная” природа кода ставила одну проблему. Почему такая случайность была всего одна? Почему не несколько? Если код произволен, то один код не должен быть особенно лучше другого. Не было никаких оснований считать, что отбор некогда создал своего рода “бутылочное горлышко”, при прохождении через которое один из вариантов кода обладал бы, по словам Крика, “таким селективным преимуществом над всеми конкурентами, что сохранился бы только он один”. Но если никакого “бутылочного горлышка” не было, то почему мы не наблюдаем сосуществования разных организмов с несколькими разными кодами? Крик всерьез задумался над этим вопросом.
Самый очевидный ответ предполагал, что все живое на земле происходит от общего предка, у которого генетический код уже был жестко закреплен. Говоря об этом в философском ключе, можно было сказать, что жизнь возникла на Земле лишь однажды, в связи с чем ее возникновение казалось событием уникальным и почти невероятным, может быть даже совершенно исключительным. По мнению Крика, это заставляло предположить заражение — однократное занесение жизни на нашу планету. Он стал отстаивать идею, что жизнь была “посеяна” на Земле в форме бактериальных клонов единственного внеземного организма. Крик пошел еще дальше: принялся доказывать, что эти бактерии были преднамеренно посеяны на Земле неким инопланетным разумом с помощью космического корабля. Крик назвал подобный сценарий “направленной панспермией”. Эту тему он разработал в книге “Жизнь как она есть”, опубликованной в 1981 году. Мэтт Ридли в своей превосходной биографии Крика писал: “Предмет этой книги вызвал немало удивления. Великий Крик пишет об инопланетных жизненных формах, рассеиваемых во Вселенной космическим кораблем? Не слишком ли успех вскружил ему голову?” Действительно ли идея случайного кода оправдывает столь далеко идущие философские выводы — вопрос спорный. Чтобы код прошел через “бутылочное горлышко”, не требуется, чтобы определенный его вариант имел какие-то особые преимущества перед другими. Сильный отбор по любому признаку, хотя бы и в результате исключительного события, например столкновения с Землей астероида, вполне мог истребить все живое на планете, кроме потомков единственного клона, которые по определению должны были обладать только одним вариантом кода. Так или иначе, Крик не вовремя выдвинул свою идею направленной панспермии. Как раз в начале 8о-х годов, когда он писал свою книгу, стало ясно, что генетический код нельзя считать ни застывшим, ни случайным. В нем есть скрытые закономерности, своего рода “код внутри кодонов”, дающий нам ключи к разгадке тайны происхождения нашего кода, возникшего почти четыре миллиарда лет назад. Теперь мы знаем, что он представляет собой не тот жалкий шифр, который так разочаровал в свое время криптографов, а единственный в своем роде код из миллиона возможных, способный противостоять изменениям и одновременно ускорять ход эволюции.
Код внутри кодонов! С 60-х годов в генетическом коде выявили целый ряд закономерностей, но большинство из них легко было отбросить как обыкновенный статистический шум (что, собственно, и делал Крик). Казалось даже, будто совокупность этих закономерностей не несет особого смысла. Хороший вопрос — почему так казалось. Этим вопросом задался калифорнийский биохимик Брайан Дэвис, уже давно интересовавшийся корнями генетического кода. Он отмечает, что сама идея “застывшей случайности” погасила интерес к проблеме происхождения кода. Какой смысл изучать происхождение случайности? Случайности случаются, только и всего. Кроме того, по мнению Дэвиса, те немногие исследователи, которые продолжали интересоваться этой проблемой, пошли по ложному пути, ухватившись за наиболее популярную в то время идею первичного бульона. Если генетический код возник в таком бульоне, то он должен восходить к молекулам, возникновение которых в результате происходивших в таком бульоне физических и химических процессов особенно вероятно. А это заставляло предположить, что в основе кода лежал некий базовый набор аминокислот, а все остальное добавилось позже. Истины в этой идее было ровно столько, чтобы данные, свидетельствующие в ее пользу, производили сильнейшее впечатление, хотя в действительности они лишь сбивали с толку. Смысл закономерностей генетического кода мы начинаем понимать лишь тогда, когда рассматриваем его как продукт биосинтеза, то есть продукт клеток, способных синтезировать собственные “строительные блоки” из водорода и углекислого газа.
Так что же собой представляют эти неочевидные закономерности? С каждой буквой триплетного кода связана некая закономерность. Особенно красноречивы свойства первой буквы, поскольку она касается процесса, позволяющего поэтапно превращать несложные вещества-предшественники в аминокислоты. Принцип, лежащий в основе этой закономерности, настолько поразителен, что его стоит здесь изложить в двух словах. В клетках современных организмов аминокислоты синтезируются посредством целого ряда биохимических преобразований, начинающихся с нескольких несложных веществ-предшественников. А удивительно здесь то, что между первой буквой триплетного кодона и этими несложными предшественниками есть определенная связь. Так, все аминокислоты, предшественником которых оказывается пируват, соответствуют кодонам, начинающимся с одной и той же буквы — в данном случае Т5. Я привел в качестве примера именно пируват, потому что мы уже встречались с этим веществом в главе 1. Оно может образовываться в гидротермальных источниках из углекислого газа и водорода при участии катализаторов — ими могут служить присутствующие в таких источниках минералы. Но это относится не только к пирувату. Предшественники всех аминокислот участвуют в цикле Кребса — основе биохимии всех клеток, и должны образовываться в щелочных гидротермальных источниках, которые мы обсуждали в главе 1. Напрашивается вывод (на данном этапе, надо признать, поверхностный, но нам еще предстоит его уточнить), что между первой буквой триплетного кода и гидротермальными источниками существует какая-то связь.
А как обстоят дела со второй буквой? Здесь наблюдается связь со степенью растворимости (или нерастворимости) аминокислоты в воде, то есть гидрофильности (или гидрофобности). Гидрофильные аминокислоты растворяются в воде, в то время как гидрофобные с ней не смешиваются, а растворяются в жироподобных веществах, таких как липидные мембраны клеток. Все аминокислоты можно распределить по своего рода спектру, начиная от “очень гидрофобных” и заканчивая “очень гидрофильными”. Именно этот спектр имеет связь со второй буквой триплетного кода. Пяти из шести самых гидрофобных аминокислот соответствуют кодоны с буквой Т в середине, а всем самым гидрофильным — кодоны с буквой А в середине. Промежуточным аминокислотам спектра соответствуют кодоны с буквой Г или Ц в середине. Таким образом, чем бы это ни объяснялось, в целом наблюдается сильная и вполне определенная связь между первыми двумя буквами каждого кодона и той аминокислотой, которую этот кодон кодирует.
Именно последняя буква приводит к вырожденности кода: восьми аминокислотам свойственна (прекрасный научный термин!) четырехкратная вырожденность. Хотя большинству читателей может показаться, что четырехкратная вырожденность означает совершенно опустившихся людей, пьяниц, которым удается падать в четыре разных канавы одновременно, биохимики обозначают этим термином ситуацию, когда третья буква кода не несет никакой информации. Независимо оттого, какое азотистое основание стоит на этом месте, во всех четырех случаях триплет кодирует одну и ту же аминокислоту. Например, в триплете ГГГ, кодирующем глицин, можно заменить последнюю Г на Т, А или Ц — и все три новых триплета будут по-прежнему кодировать глицин.
Вырожденность кода по третьей букве имеет несколько интересных следствий. Мы уже отмечали, что дублетный код мог бы кодировать только шестнадцать из двадцати входящих в состав белков аминокислот. Если исключить из их списка пять самых сложных (оставив, таким образом, пятнадцать, плюс стоп-кодон), закономерности, касающиеся первых двух букв, окажутся выражены еще ярче. Так что, возможно, код первоначально был дублетным и лишь потом расширился до триплетного в результате “присвоения кодонов”: аминокислоты могли соперничать друг с другом за третью букву. Древнейшие аминокислоты, вероятно, получили “нечестное” преимущество в борьбе за “прикарманивание” триплетных кодонов, и очень похоже, что так оно и было. Например, те пятнадцать аминокислот, которые скорее всего кодировались первоначальным дублетным кодом, загребли себе 53 из 64 возможных триплетов (в среднем 3,5 кодона на аминокислоту), в то время как оставшиеся пять “позднейших” аминокислот разделили между собой лишь восемь кодонов (в среднем 1,6 на аминокислоту). Очень похоже, что здесь кто успел, тот и съел.
Давайте подробно рассмотрим следующую возможность: код первоначально был дублетным, а не триплетным, и кодировал пятнадцать аминокислот (плюс один стоп-кодон). Этот первоначальный код, судя по всему, был почти полностью детерминирован, то есть продиктован физическими и химическими факторами. Есть немного исключений из того правила, что первая буква связана с предшественником, а вторая — с гидрофильностью или гидрофобностью аминокислоты. Здесь было мало простора для игры случая, не было свободы от физических законов.
Но с третьей буквой дело обстояло иначе. Здесь было куда больше возможных вариантов, и многое могло произойти по воле случая, после чего отбор получал возможность “оптимизировать” полученный код. Такое смелое предположение высказали в конце 90-х годов два английских специалиста по молекулярной биологии, Лоренс Херст и Стивен Фриленд. Эти два исследователя получили известность благодаря своей совместной работе по сравнению генетического кода с миллионами случайных кодов, сгенерированных компьютером. Они оценивали потенциальный вред точечных мутаций, при которых одна буква кодона заменяется другой. Исследователи задались вопросом, какой код лучше всего противостоял бы таким мутациям, либо по-прежнему кодируя все ту же аминокислоту, либо меняя ее на другую, похожую. Оказалось, что настоящий генетический код поразительно устойчив к таким изменениям: точечные мутации часто вообще не влияют на последовательность аминокислот, а если все-таки влияют, то аминокислота обычно заменяется на другую, близкую к исходной. Более того, Херст и Фриленд пришли к выводу, что наш генетический код лучше миллиона альтернативных кодов, сгенерированных случайным образом. Он оказался отнюдь не жалкой поделкой слепого шифровальщика, а уникальным продуктом, единственным из миллиона. Авторы этой работы утверждают, что наш код не только устойчив к потенциальным изменениям — он нейтрализует возможные катастрофические последствия тех изменений, которые все-таки происходят и тем самым ускоряют эволюцию. Ведь ясно, что у мутаций намного больше шансов оказаться полезными, если они не ведут к катастрофическим последствиям.
Не постулируя вмешательство божественного замысла, подобную оптимизацию можно объяснить только работой отбора. А если так, то шифр жизни должен был эволюционировать. И действительно, целый ряд незначительных вариаций этого “универсального” кода, наблюдаемых среди бактерий и митохондрий, говорит именно о том, что генетический код все-таки может эволюционировать — по крайней мере, при исключительных обстоятельствах. Но как, спросите вы вслед за Криком, он может меняться, не вызывая бедствий? Ответ: постепенно. Если аминокислота кодируется четырьмя или даже шестью разными кодонами, то некоторые из них могут использоваться чаще других. Редко используемые кодоны вполне реально передать другой (но, вероятно, близкой) аминокислоте, не вызывая катастрофических последствий. Именно так генетический код может эволюционировать.
Итак, в целом “код внутри кодонов” говорит нам о процессе, первоначально связанном с биосинтезом и водорастворимостью аминокислот, а затем проходившем фазы расширения и оптимизации. Возникает вопрос: что это был за процесс, на который начал действовать естественный отбор?
Точного ответа на этот вопрос нет, и несколько препятствий затрудняют его поиски. Одним из первых оказалась проблема ДНК и белков (напоминает давнюю проблему — что было раньше, курица или яйцо). Проблема в том, что ДНК сама по себе более или менее неактивна, так что даже для удвоения ее молекул требуются специальные белки. С другой стороны, специальные белки не могли стать специальными случайно. Они должны были эволюционировать путем естественного отбора, а для этого требовалось, чтобы их строение было, во-первых, наследуемым, а во-вторых, изменчивым. Белки не работают как наследуемая матрица для синтеза самих себя: их кодирует ДНК. Значит, белки не могут эволюционировать без ДНК, а ДНК не может эволюционировать без белков. А если одно не могло эволюционировать без другого, то отбору не с чего было начинать.
В середине 8о-х годов было сделано поразительное открытие. Выяснилось, что РНК может работать катализатором. РНК редко сворачивается в двойную спираль: она чаще существует в виде небольших молекул, образующих структуры сложной формы, способные выполнять каталитические функции. РНК позволяет разорвать порочный круг. В гипотетическом “мире РНК” она могла брать на себя роль как белков, так и ДНК, катализируя, наряду со многими другими реакциями, синтез самой себя. Вдруг оказалось, что генетический код поначалу мог вообще не иметь отношения к ДНК: он мог вырасти из непосредственных взаимодействий РНК с белками.
Все это выглядело вполне логично в свете того, что уже было известно о работе современных клеток. Теперь ДНК в клетках непосредственно с аминокислотами не взаимодействует, но многие из ключевых реакций, участвующих в синтезе белков, катализируются именно РНК-ферментами — так называемыми рибозимами. Термин “мир РНК” предложил Уолтер Гилберт, гарвардский коллега Уотсона, в одной из самых читаемых статей, когда-либо опубликованных в журнале “Нейчур”. Идея Гилберта произвела огромное впечатление на всех, кто занимался поисками истоков генетического кода. Изначальный его смысл, оказывается, состоял не в том, как ДНК кодирует белки, а в том, какого рода взаимодействия должны были происходить между РНК и аминокислотами. Однако ответ на поставленный вопрос был по-прежнему не очевиден.
Учитывая, какой интерес вызвала гипотеза мира РНК, может показаться странным, что мало кто обращал внимание на каталитические свойства маленьких фрагментов РНК. Если большие молекулы РНК могут катализировать различные реакции, вполне можно ожидать, что и совсем маленькие фрагменты РНК — отдельные “буквы” или пары “букв” — тоже могут катализировать какие-то реакции, хотя и не столь эффективно. Недавние исследования, которые совместно провели почтенный американский биохимик Гарольд Моровиц, специалист по молекулярной биологии Шелли Копли и физик Эрик Смит, указывают именно на эту возможность. Даже если идеи этих авторов и ошибочны, по-моему, именно такого рода теорию нам нужно искать, чтобы объяснить происхождение генетического кода.