Форматы 2D и 3D

Форматы 2D и 3D

Удивительная организация генетического кода дает пищу великому множеству теоретиков и любителей для конструирования не только различного рода таблиц, но и объемных моделей. Большое количество разнообразных моделей кода можно отыскать в специальной и в не слишком специальной литературе. Автор не берется даже за краткий обзор результатов этой деятельности. Некоторые из них, на его вкус, как минимум, не интересны – например, попытка проводить параллели между организацией генетического кодирования и смысловым содержанием гексаграмм китайской Книги Перемен. В других он ничего не понимает – например, в топологической модели Владимира Карасева или в волновых моделях Петра Гаряева. В свое время Автор и сам оказался под некоторым впечатлением от трехмерной модели Трейнора и сотрудников – правда, потому только, что она представляла собой тетраэдр. Но модель строилась на основе кодирующих триплетов, а поскольку число их – 64 (не-тетраэдрическое), такой многогранник можно было построить только по определенным, не слишком логичным правилам. Гексаэдр (куб) годится для этой цели куда больше, поскольку 64=43, но он не так выразителен и опять-таки базируется на организации лишь одного из двух компонентов кода – азотистых оснований; кроме того, он уже практически использован в «обыкновенной» таблице генетического кода 4х4х4.

Некоторые модели остаются в тени или забыты совершенно незаслуженно. Например, объемная модель генетического кода Rafiki, Inc., выполненная в виде игрушки (см. рисунок и развертку), могла бы, как минимум, использоваться на уроках биологии и будила бы воображение молодых людей, подогревая их интерес к этой науке и определяя и их, и ее будущее.

Эта игрушка представляет собой додекаэдр, «кристалл», собранный из 120 тетраэдров (Автор не вдается здесь в детали е? построения, их можно найти на сайте http://www.codefun.com/Index.htm). Разумеется, ничего подобного в природе нет, зато модель Рафики хорошо иллюстрирует симметрии кодирования и даже некоторые аспекты укладки белковых молекул.

Между тем число продуктов кодирования (20) дает соблазн собрать именно тетраэдр; надо только сформулировать простой принцип сборки, желательно учитывающий и кодирующие основания, и кодируемые аминокислоты, помня об упомянутом выше ограничении Эйгена: теория может быть корректной или нет; модель имеет третью возможность – оставаясь корректной, совершенно не относиться к делу (a theory has only the alternative of being wrong; a model has a third possibility – it might be right but irrelevant61). Зато у модели, как и сказано в Главе 69, есть и очевидное достоинство: представляя явление в неожиданном ракурсе, она заставляет думать.

Здесь мы, однако, рассказываем не просто о геометрической симметрии генетического кода (о ней уже шла речь в Главе А), но о моделях, симметрия которых базируется на оцифровке генетического кода, реализуемой по тому или иному принципу. Более того, этот подход привлекает нас, в первую очередь, тогда, когда такой оцифровке подвергаются оба компонента кода, а не только продукты кодирования. В конце предыдущей главы (Глава Б) мы описали «виртуальный олигопептид», который демонстрировал равновесие совокупных нуклонных масс стандартных и вариабельных частей кодируемых продуктов. Мы обнаружили, что этот «олигопептид» имеет любопытные арифметические свойства в отношении составляющих его кодирующих оснований, которые, неожиданно подчеркивают акцентируемый Щербаком децимализм генетического кода. Параметр, выявляющий обнаруженные свойства, представляет собой простой номер каждого из четырех азотистых оснований в их упорядоченном по изменению молекулярной массы ряду. В данной главе мы попытаемся проанализировать организацию генетического кода, используя оба указанных параметра (нуклонные числа и порядковые номера) обоих компонентов кода. Если эта попытка окажется удачной, и мы найдем, что одна и та же организация кода (модель) характеризуется арифметическими симметриями по каждому из этих параметров, тогда легкомысленная готовность Автора сравнивать десятичное число 3412 и цифровой ряд 3412 по чисто внешнему сходству, может показаться Читателю не такой уж смешной.

Вернемся к матрице генетического кода, «аналоговая» версия которой описана в Главе А. Ее оцифровка в параметрах нуклонных масс («сжатая» версия – без пятой, @-строки) реализуется упорядоченными по массе последовательностями первых кодонных оснований (по вертикали) и соответствующих им продуктов (по горизонтали); слева – аминокислоты в «нейтральной» версии (0), справа – в заряженной (+/-). Под символом каждой аминокислоты – ее нуклонная масса (нуклонная масса боковой цепи ее молекулы).

Организующая матрицу последовательность первых триплетных букв – CTAG – демонстрирует не только симметрию по комплементарности С?G, A=T (черточки между основаниями символизируют число водородных связей, которые их объединяют), но и совпадающую с ней количественную симметрию цифрового ряда 1234: 1+4=2+3. Комплементарность оснований позволяет собрать и другой ряд – AGCT, в котором упорядоченность по массе комплементарных пар имеет общее направление. Этому ряду и соответствует цифровая последовательность 3412, описанная в предыдущей главе.

Теперь, чтобы объединить в общем представлении и аминокислоты, и азотистые основания, надо описать те и другие в общих терминах. В нашем случае это – либо нуклонная масса вариабельных частей молекулы, либо простое перечисление элементов, упорядоченных по массе. Выбор вариабельной части молекул аминокислот очевиден – это их боковая цепь. Вариабельная часть молекулы азотистого основания не представляет собой столь ясно выделяемую структуру. В то же время стандартным блоком, общим для всех оснований, является вполне выраженная структура – гексацикл (шестичленное кольцо из четырех атомов углерода, 2—4—5—6, и двух – азота 1—3):

Мы подошли к выбору нуклонного параметра азотистого основания совершенно формально: все атомы вне упомянутого гексацикла и составляют нуклонное число этого основания. Таким образом, цитидину С соответствует (в полинуклеотидной цепи) нуклонная масса 34, тимину Т – 49, аденину А – 58, а гуанину – 74. Если сопоставить комплементарные пары GC и АТ четверки нуклеотидов и их нуклонные массы, объединенные водородными связями (то есть общими для обоих членов пары протонами), получим равенство: 34+74—3 = 49+58—2 = 105 = 11х1114. Стоит отметить, что все эти рассуждения относятся только к ДНК, потому что урацил U, заменяющий в четверке оснований РНК тимидин Т, имеет нуклонную массу 35, нарушающую описанные равновесия. Смысл этого обстоятельства должен отражать различия в физико-химии РНК и ДНК: возможно, дело в том, что предпочтительная структура ДНК линейна, а ее двойная спираль, уравновешенная также в описанных терминах, стабилизирует предпочтительную (линейную) запись генетической информации. РНК – в отличие от ДНК может приобретать более разнообразную конформацию, включая такую, которая позволяет ей обладать некоторыми свойствами полипептида – например, энзиматическими. В отличие от описанного выше МПП, молекула которого обладает собственным равновесием – за счет равновесия константных и вариабельных частей аминокислот, молекула ДНК приобретает равновесие только за счет объединения в спираль двух комплементарных полимеров. Само же по себе молекулярное равновесие – это характерное свойство – если не естественных биополимеров самих по себе, – то, во всяком случае, организации их генетического кодирования.

Соответствующая (реципрокная, симметричная) операция с аминокислотами, которые уже охарактеризованы в терминах нуклонных масс, – это придание им порядковых номеров в последовательностях, упорядоченных по молекулярной массе. Мы используем два варианта такой нумерации: сплошное (прямое или обратное) перечисление аминокислот в «нейтральной» версии (а) и общее или раздельное их перечисление (также в обоих направлениях) в составе арс-классов – параллельное и антипараллельное (б). Другие варианты Читатель может рассчитать самостоятельно; мы только предупредим его, что результаты в принципе будут однотипными.

В таблице Б темно-серым выделены позиции маркирующих каждый класс аминокислот. В матрице они симметричны относительно центральной вертикальной колонки. Соответствующие пары аминокислот практически симметричны (равновесны) и по нуклонным массам (72+58 ? 130+1). Посмотрим, как матрица выглядит с точки зрения описанных параметров:

Общие нуклонные суммы симметричных пар столбцов 1-го и 3-го, 2-го и 4-го в матрице кода близки к равенству – или равны (176+320 = 118+378 = 496), если гистидин Н полностью протонирован (в версии «заряженной» матрицы), то есть имеет нуклонное число 82. Очень вероятно, что все это – не более, чем случайность, игра в цифры, – особенно если принимать во внимание, что 496 – единственное трехзначное (как и всякий кодон) совершенное число; выше мы уже отмечали это. Но продолжая эту игру, мы сталкиваемся с симметриями и соотношениями, которые озадачивают все больше. Зачем все это генетическому коду, «замороженной случайности», как назвал его Крик?

Приняв за случайность сам децимализм кода, на котором настаивает доктор Щербак, обнаруживаем, однако, что таблица кода в значениях нуклонных масс демонстрирует хорошо организованный набор информационных сигнатур 111 в системах счисления 5—9:

Ярко-зеленым в Таблице 11 отмечены ячейки тех аминокислот, нуклонная масса которых принимает значение 111 в той или иной системе счисления (номер системы счисления принято указывать справа и снизу от числа; номер десятичной системы не указывается). Бледно-зеленым отмечены ячейки тех аминокислот, нуклонная масса которых принимает значение 111 при определенных условиях: сложение нуклонных масс гистидина Н (81+) и триптофана W (+130) дает 211=11114 (других таких смежных пар в матрице нет), нуклонная масса лизина становится 111в зарядовой версии этой аминокислоты, а нуклонная масса глицина – это базовый нумерал (цифровой символ) для подобных чисел. Сумма всех закрашенных ячеек матрицы кода составляет 7779.

Если скептически настроенный Читатель готов счесть вс? это случайностью, обратимся на время к порядковым параметрам кодируемых аминокислот. В их значениях симетрии матрицы генетического кода приобретают такой вид:

Все три таблицы практически одинаковы. В левой матрица состоит из двух блоков – PSTGRWME и LQHFNAVD, симметричных относительно центральной колонки (а также относительно границы между первыми кодонными пуринами и пиримидинами) и равновесных по суммам позиционных номеров (81=81), а также двух «внутренних» (неокрашенных) пар с соотношением сумм 1:2. В центральной эти два блока разделены на две симметричные части каждый (PGRE и LHAD; 37=37) и STWM и QFNV (44=44). В правой таблице попарно соединены «угловые» блоки PIDE и GAHR, симметричные по диагоналям – так что каждая четверка характеризуется суммой 37. В принципе все эти значения можно в какой-то мере, рассматривать, как указание на децимализм генетического кода, на который указывают числа 37 (37*3=111) и «гомодублеты» 44 и 88. Читатель, возможно, найдет в матрице кода и другие симметрии.

Мы же попытались связать симметрии двумерной матрицы с симметриями трехмерного (объемного) тела, геометрическая симметрия которого задавалась бы по определению: в нашем случае, как мы об этом сказали выше, это простейшее платоново тело, тетраэдр. Нам хотелось найти тетраэдр, в котором формальное равновесие (например, равенство кооперативных нуклонных масс граней) сочеталось бы с равновесием по какой-либо из четко определенных функций, например, по принадлежности к синтетазному классу. Принципиально такая возможность возникает, если принять 20 кодируемых аминокислот с их числовыми параметрами за 20 равновеликих сфер-мономеров. Двадцать мономеров тетраэдра делятся на две структурообразующие группы:

инвариантные мономеры (i), т. е. мономеры вершин (v) и центров граней (c), взаимозамена которых сохраняет общую нуклонную массу граней, и

пара «внутренних» мономеров (e) каждого ребра, не входящих в группу (i).

Мы нашли, что весьма простое условие, а именно – зеркальная симметрия пар мономеров групп i (v, c) и e относительно оси матрицы, разделяющей первые пурины и пиримидины, при равенстве сумм нуклонных масс v и c и при размещении этих пар во всех четырех столбцах, позволяет сконструировать единственный тетраэдр, который, однако, характеризуется не полной, но билатеральной симметрией (нуклонным равновесием пар) граней при минимальном «размахе» по их нуклонным массам. Числовые значения этого равновесия в десятичной и в пятеричной системах счисления выражаются так:

(626+629 = 627+628)10, или:

(10.001+10.004=10.002+10.003)5.

Пару инвариантных мономеров составляют два мономера v и c, кодируемые одной и той же первой буквой, а пару е составляют внутренние мономеры ребра, также кодируемые одной и той же первой буквой; в обоих случаях используются все четыре основания. Поскольку у тетраэдра шесть пар е, а строк в матрице четыре, то две из этих пар (перекрещивающиеся), хотя и следуют указанному принципу, симметричны лишь в общем, пурин-пиримидиновом, формате – при условии принадлежности S и R к группе вырожденности II: T-R (кодирующие дублеты AC-AG) и S-E (кодирующие дублеты AG-GA или RG-RA). Поразительно, но этот простой принцип, иллюстрируемый приведенной ниже матрицей:

сводит число возможных версий трехмерной модели кода к единственной:

Правда, равновесную по граням модель можно также построить, заменив ребра QH и VD на QV и НD и сохранив, таким образом, симметричный рисунок реберных мономеров в составе матрицы, однако, эта версия потребует сделать формулировку принципа сборки тетраэдра более свободной, поскольку наш тетраэдр характеризуется также полной симметрией по граням аминокислот двух арс-классов:на каждую его грань приходится равное (по 5) число мономеров-аминокислот каждого класса.

Других столь же простых условий сборки тетраэдра с нуклонным равенством граней не существует. Также (естественно) не удается сформировать подобный тетраэдр, используя значения порядковых номеров этих мономеров в качестве их альтернативных параметров. Количественная симметрия имеет место только в отношении номеров инвариантных мономеров сплошной последовательности аминокислот (независимой от арс-класса): суммы номеров мономеров вершин полученного тетраэдра и центров его граней равны (и в случае нумерации по нарастанию нуклонной массы составляют замечательное – в контексте этой и предыдущей глав – десятичное число 37).

Инвариантные мономеры и сами по себе обладают целой серией собственных симметрий по первым, вторым и третьим основаниям своих кодонов, что является следствием их положения в составе матрицы кода. Читатель может самостоятельно организовать и проанализировать таблицы, необходимые для демонстрации этих симметрий.

В формате позиционных номеров аминокислот, принадлежащих к тому или другому арс-классу, отметим, что значения колоночных и построчных суммаций матрицы генетического кода имеют весьма замечательный вид: линейное нарастание сумм порядковых номеров центральных колонок, выраженное двух– или трехзначными инфрмационными символами, в комбинации со сдвиговой для трехзначных чисел (или зеркальной для двузначных) симметрией цифр в крайних колонках, а также в строках, соответствующих первым комплементарным основаниям кодонов:

Читателю предлагается обратить внимание на следующее:

цифровые гомодублеты, как носители информации о симметрии, имеют здесь не меньшее значение, чем гомотриплеты;

в тех случаях, когда значения линейно нарастающих сумм порядковых номеров центральных колонок в той или иной системе счисления не подчеркнуто гомодублетами 11—22—33 или гомотриплетами 111—222—333, цифровые симметрии сумм крайних колонок «комплементарны», так что сумма двух крайних колонок представляет собой следующий гомодублет (44) или гомотриплет (444);

в тех случаях, когда значения сумм колонок или строк имеют неодинаковое число разрядов в той или другой системе счисления, цифровые симметрии сумм крайних колонок невыразительны;

то обстоятельство, что таблица справа (где арс-классы представлены как самостоятельные группы, то есть члены каждой имеют собственную, а не последовательную, нумерацию) демонстрирует симметрии не только по колонкам, но и по строкам, свидетельствует об определенной независимости классов;

наконец, то обстоятельство, что обе таблицы демонстрируют не только числовые, но и цифровые симметрии, как будто поддерживает логику сравнения числового значения и цифрового порядка, которые – имея общее выражение – характеризуют описанный в предыдущей главе виртуальный олигопептид.

Паттерн этих матричных симметрий в значениях порядковых номеров аминокислот сходен с паттерном симметрий матрицы в значениях их нуклонных масс (см. выше):

…………………

И хватит, пожалуй. Автору не хочется больше надоедать Читателю похожими друг на друга таблицами и «интересными» числами. Пора подумать, что все они означают. Сумбур и брызги негромкого, но явственно различимого ритма Музыки Сфер? Сто лет назад Бернард Шоу (одно время музыкальный критик) – словно предчувствуя расцвет сегодняшней глянцевой «звездятины» – заметил, что музыка – это алкоголь осужденных грешников62. Справедливо, конечно, если скорбеть животом в такт второй симфонии Бетховена (http://galicarnax.livejournal.com/25217.html). Но так ли уж нужны стигматы святой Терезе? Так ли они ей желанны?

Однако, ничего не знал Бернард Шоу о генетическом коде, а известный вопрос Уильяма Блейка, странным образом о нем (коде) напоминающем, не мог прийти поэту в голову иначе, как в ассоциации с бенгальским тигром:

What immortal hand or eye,

Dare frame thy fearful symmetry?

А нам сегодня – мог, и ничего страшного (fearful) или рокового, судьбоносного (fateful) – достаточно чуть-чуть «буквализировать» великолепный перевод Самуила Маршака:

Кем задуман роковой

Соразмерный образ твой?

Данный текст является ознакомительным фрагментом.