Глава G@С. Генетический код – явление «героя» (Х)

Глава G@С.

Генетический код – явление «героя» (Х)

События, связанные с эволюцией Вселенной и коротко описанные выше, привели, в конечном счете (а может быть, и «в том числе») к возникновению жизни, центральным феноменом которой стало объединение мира нуклеиновых кислот и мира белков в единую автокаталитическую суперсистему, для чего потребовалось связующее звено обоих миров, доведенное до необходимого состояния – так называемый генетический код. Генетический код – это набор инструкций для однонаправленного перевода нуклеотидной последовательности в полипептидную. Таким образом, сегодняшний код составляют два компонента. Первый кодирующий компонент – это четыре азотистых основания (или нуклеотида, когда они фосфорилированы и составляют цепи РНК или ДНК).

Общее обозначение азотистых оснований приведено в таблице:

Из них состоит полинуклеотид – рибо– или дезоксирибонуклеиновая кислота, РНК или ДНК. В случае РНК четыре нуклеотида – это два пурина (аденин и гуанин в табличках ниже) и два пиримидина – урацил и цитозин. В молекуле ДНК одно из перечисленных оснований – урацил – заменен на тимин (T):

Полимером правовращающего сахара – рибозы или дезоксирибозы – в цепочку РНК или ДНК соединены трифосфаты этих оснований. Здесь показаны структуры одноцепочечных молекул ДНК (вверху) и РНК (внизу):

Второй кодируемый компонент генетического кода – это аминокислоты, из которых состоят полипептиды или белки. Из более ста пятидесяти природных аминокислот кодируемыми являются (по преимуществу) только 20:

Для обозначения аминокислот (напомним, что кодируемыми являются альфа-L-аминокислоты) используют либо трех-, либо однобуквенные символы; мы – как уже сказано – будем пользоваться последними. В таблице выделены гидрофильные (синие ячейки и белые буквы названий) и гидрофобные (желтые ячейки) аминокислоты, аминокислоты, способные нести заряд, отмечены знаками (+) или (-), ароматические аминокислоты (бирюзовые ячейки в колонке символов, иминокислота пролин – бирюзовое выделение); серусодержащие аминокислоты (желтые ячейки в колонке символов). В формуле молекул справа – одна и та же константная часть (участвующая в пептидной связи; полужирный шрифт), слева – боковая часть молекулы или радикал (R). Молекула пролина приведена к общей схеме гипотетическим размыканием (релаксацией) иминного кольца.

Очевидно, что аминокислоты отличаются друг от друга химической природой боковой цепи, которая состоит из группы атомов в молекуле аминокислоты, связанной с ?-углеродным атомом и не участвующей в образовании пептидной связи при синтезе белка. Вс? разнообразие особенностей структуры и функции белковых молекул связано с химической природой и физико-химическими свойствами радикалов аминокислот. Именно благодаря им, белки наделены рядом уникальных функций, не свойственных другим биополимерам, и обладают химической индивидуальностью. Благодаря им, вновь синтезирующаяся полипептидная цепочка приобретает вторичную структуру, образуя определенной длины однотипные спирали, складчатость и повороты (изломы). Эта структура, в свою очередь, складывается в уникальную третичную, которая и обладает определенными функциями. Они могут быть усилены или модифицированы четвертичной белковой структурой, которую формируют уже не отдельные полипептиды, а их комбинация.

Это общие сведения (trivia) о компонентах генетического кода. Приводим его стандартную (каноническую) таблицу. Синим выделены в ней кодирующие и кодируемые элементы группы вырожденности IV октета (см. ниже); серым – элементы октета групп вырожденности (темно-серые), III (светлее) и II (еще светлее). В неокрашенных ячейках – терминирующие кодоны. Чтобы подчеркнуть характер непосредственных участников процесса декодирования, то есть молекул РНК, четырьмя основаниями в таблице часто выбираются основания U, C, и G. Именно на таком порядке настаивал Френсис Крик – не помню точно, почему, – может быть, потому, что, скажем, теория граничных орбиталей химической реактивности, которая была разработана для сравнения вероятностей стабилизации избыточных электронов для различных ДНК-составляющих, предсказывает снижение электронного сродства и потенциалов ионизации, подтверждаемое экспериментальными данными, именно в порядке TCАG51.

ВТОРОЙ НУКЛЕОТИД

Функция молекулы ДНК – не декодирование, но хранение генетической информации. Поскольку выбор «главной» из этих двух функций – задача очевидно нелепая, таблицы кода с ДНК-основаниями Т, C, и G встречаются не менее часто.

Напомним теперь восемь основных свойств генетического кода, определяющих сопоставление нуклеотидов и аминокислот, и девятое – альтернативное.

Первое из них – триплетность, означающая, что каждую используемую в живых структурах аминокислоту кодируют три последовательно (то есть от 5`– к 3`-концу цепи) расположенных азотистых основания. Их называют триплетом или кодоном. В таблице первым двум основаниям соответствуют вертикальная и горизонтальная координаты; третье основание показано по вертикали справа, оно делает двумерную таблицу трехмерным кубом 4 х 4 х 4.

Физических промежутков между кодонами нет, поскольку код характеризуется непрерывностью. Если бы код был синглетным, то есть если бы каждой кодируемой аминокислоте соответствовало бы только одно основание (из четырех), кодирующая емкость кода и составляла бы только четыре аминокислоты. Между тем, таких аминокислот двадцать, и только этого числа (не меньше!) достаточно для обеспечения существующего белкового разнообразия. Если бы код был дублетным, то есть, если бы каждой кодируемой аминокислоте соответствовало бы два основания, кодирующая емкость кода составляла бы только шестнадцать аминокислот (42) – то есть очевидно недостаточно. Емкость триплетного кода составляет 64 аминокислоты (43). Этого хватает с избытком.

«Избыток» составляет 44 кодируемых продукта. Многие исследователи утверждают, что эволюция генетического кода шла в направлении от синглетного к триплетному. При этом они не понимают, что смена размера кодирующей единицы потребовала бы принципиального изменения всей машины кодирования (то есть всего набора ферментов, обслуживающих этот процесс) – вещь невозможная! Поэтому синглетный этап триплетного кодирования (если он был) мог означать, что в составе триплета значащей единицей могла быть только одна (например, первая или любая), а в составе дублета – две. Тогда и непрерывность кодированной записи могла быть только физической. Функционально значащие основания разделялись остальными основаниями триплета, а эволюция продолжала совершенствовать структуру молекул-участников кодирования. Произвольные (из четырех) третьи основания современных кодонов для восьми (из двадцати) аминокислот могут быть реликтами до-триплетных кодов. Выбор же тройки азотистых оснований в качестве дискретной единицы генетического кода мог быть обусловлен также термодинамикой взаимодействия пар оснований, при котором матричное копирование инициируется их триплетом (мы говорили об этом выше, ссылаясь на Зенгера).

Неперекрываемость – один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов; не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки.

Поскольку никакого избытка в крайне экономной природе не бывает, он и здесь компенсируется еще одним свойством, парадоксально именуемым вырожденностью (избыточностью), которая означает, что каждую аминокислоту (два исключения – метионин и триптофан) кодирует более, чем один триплет. Синим выделены клетки таблицы, содержащие аминокислоту, кодируемую четырьмя триплетами, серым – тремя, светло-серым – двумя, самым светлым – две аминокислоты, кодируемые только одним триплетом.

Однозначность кода означает, что каждый триплет фрагмента полинуклеотида, именуемого геном, кодирует только одну аминокислоту. Продуктами кодирования являются не только аминокислоты, но и знаки пунктуации – знак начала кодирующей цепочки (гена), ATG, или AUG, называемые стартовыми кодонами, и знаки ее окончания – TAA (UAA), TAG (UAG) и TGA (UGA) или терминирующие (trm) стоп-кодоны (в таблице – буквы синего цвета в бесцветных ячейках). Начало генного продукта – это всегда аминокислота (метионин в данном случае), конец его – аминокислота, предшествующая стоп-кодону.

Еще одно свойство генетического кода – универсальность, означает, что все живущие на Земле существа – будь то РНК– или ДНК-вирус, слон, морковка, червь или человек – пользуются одним и тем же генетическим кодом. Немногочисленные отклонения от этого правила касаются лишь отдельных аминокислот и являются, скорее всего, именно отклонениями, результатом весьма длительной эволюции в специфических условиях.

Небольшое число таких отклонений лишь подчеркивают седьмое из перечисляемых свойств кода – необычайная стабильность.

За этим свойством неизбежно должно стоять – и стоит – еще одно – столь же необычайная помехоустойчивость. Помехоустойчивость относится к двум наиболее важным свойствам кодируемых аминокислот – их размеру, который характеризуется объемом или массой молекулы, и их гидрофильности (и гидрофобности), которые определяют вторичную структуру полипептида. Замена третьего основания триплета, как правило, не влияет на эти свойства, замена второго более существенна и относится, по преимуществу, к гидрофильности аминокислоты или к ее гидрофобности, замена первого может оказаться роковой; она меняет размер кодируемой молекулы. Если подсчитать, сколько замен одного нуклеотида не меняет тип аминокислоты в соответствии с ее химическими свойствами (а такие замены аминокислот слабо сказываются на структуре и функциях белка) и сколько меняет, то отношение первых ко вторым будет близко к 2,25. Расчеты показывают, что существующий генетический код не является самым оптимальным вариантом кода по признаку помехоустойчивости, и специальными программами удается сгенерировать более устойчивые в этом отношении коды. Тем не менее, компьютерное моделирование демонстрирует вполне впечатляющую частоту кодов со сходной с существующим помехоустойчивостью – один на миллион. Даже при такой частоте число помехоустойчивых кодов еще достаточно велико, чтобы вызывать впечатление случайности выбора той версии, которая используется на Земле. А так и не достигнутый за миллиарды лет максимум помехоустойчивости генетического кода на нашей планете наводит на мысль о том, что его, скорее всего, определило некое единичное событие, после которого опять-таки некое ограничение фиксировало девятое свойство кода, отмеченное еще Френсисом Криком. Поскольку ни изощренные и длительные эксперименты, ни теория – во времена Крика – не показывали абсолютно никакого физико-химического соответствия между нуклеотидными триплетами и аминокислотами, он назвал не поддающийся изменениям в течение миллиардов лет генетический код замороженной случайностью. Замороженной – в том смысле, что сформировавшись, он уже не менялся. Случайностью – в том смысле, что он мог сформироваться каким угодно. А вот то, что он сформировался именно таким, каким мы его видим, и настолько удачно, что в дальнейшем мог уже и не меняться, придает ему, на первый взгляд, свойство чуда. На сегодняшний день оценка Крика – едва ли не самая убедительная гипотеза происхождения генетического кода. И все-таки, когда мы говорим «случайность», рассматривая формальные свойства кода (мы сделаем это позднее), не только физика и химия приходят нам в голову. Но и они (физика и химия) предлагают сегодня альтернативную замороженной случайности гипотезу, гипотезу «ключ-замок», основанную на экспериментальных данных, которые все же показывают определенное сродство отдельных аминокислот с отдельными РНК-последовательностями. Об этом – в конце книги.

…………………

«Номер» этой главы назван «инициалами» ее «главного героя» – Genetic Code. Автор хотел, однако, не только отметить их совпадение с принятым обозначением пары гуанин-цитозин (GC), но акцентировать комплементарность этой пары, которую в названии главы подчеркивает вторая комплементарная пара – аденин-тимин (АТ), символ которой (предлог at) обозначается на «компьютерном языке» знаком @. Если пару АТ встроить между G и C, вся четверка – GA?TC – оказывается упорядоченной по массе и зеркально симметричной по комплементарности относительно центра, отмеченного двумя короткими вертикалями. В составе двуцепочечной молекулы нуклеиновой кислоты пара GC демонстрирует сильное, S, взаимодействие, образуя три межнуклеотидных водородных связи C?G (нижняя пара на рисунке), в то время, как пара АТ (верхняя часть рисунка) демонстрирует слабое, W, взаимодействие:

Результатом комплементарности пар оснований является первое правило Чаргаффа: число гуанинов (G) в двуцепочечной ДНК равно числу цитозинов (С), а число аденинов (А) равно числу тиминов (Т). Это правило стало одним из краеугольных камней открытия спиральной структуры этой молекулы, о чем можно прочитать в любом учебнике.

Позднее мы коротко коснемся и так называемого второго правила Чаргаффа, которое относится только к одной природной полинуклеотидной цепи. Существуют и некомплементарные взаимодействия пар оснований – «качающиеся» и хугстеновские (см. ниже). В природе все намного интереснее и богаче, чем в любом учебнике. Мы не можем обусловить начало жизни только формированием генетического кода (тогда ее дефиниция оказалась бы не слишком трудной задачей и упомянутое выше следствие теоремы Г?деля удалось бы обойти), какие-то свойства жизни мы различаем и до этого события, но беспрецедентная универсальность кода – при физико-химической произвольности – делает его едва ли не главной меткой нуклеиново-белковой жизни. И далее мы будем говорить именно о генетическом коде.

Данный текст является ознакомительным фрагментом.