Форматы 1D и 2D
Форматы 1D и 2D
Строго говоря, барионным числом называется сохраняемое квантовое число системы. Нам нет необходимости углубляться в эту тему. Может быть, стоит помнить лишь то, что барион – это элементарная частица, состоящая из трех кварков. Все частицы, состоящие из трех кварков, имеют барионное число +1. Наиболее стабильные барионы – это протоны и нейтроны, называемые нуклонами. Из них состоят ядра атомов. Атомы формируют молекулы, в том числе молекулы двух компонентов генетического кода – азотистых оснований и аминокислот. Нуклоны входят в семейство адронов и являются самыми легкими барионами. Именно из барионов построена подавляющая часть наблюдаемого нами вещества. С точки зрения электромагнетизма, определяющего межатомные взаимодействия, протоны и нейтроны, разумеется, различны, но в терминах сильного взаимодействия, которое является основным в масштабах атомного ядра, они различаются только изоспинами и являются, по существу, одной частицей, нуклоном. Все эти пояснения я привожу здесь для того только, чтобы напомнить читателю, что адроны появились в первые десять миллисекунд после Большого Взрыва. Именно адроны (то есть барионы, то есть нуклоны) и являются костяшками тех счет, на которых Автор намерен отстучать большую часть Главы Б, поскольку не может исключить, что этот инструмент был уже использован на Земле 4.5 миллиардов лет назад.
В 1980г Хасегава и Мията59 предложили целочисленный вариант параметра массы аминокислот – число нуклонов в молекуле; позднее Владимир Щербак (см. Примечания к Главе 111) использовал его для демонстрации арифметического содержания генетического кода. Термин нуклонная масса и будет использован далее. Термин барионное число не применяется к молекулам, иначе он бы только запутал дело (хотя математически он точно соответствует нуклонной массе). Он фигурирует только в названии этой главы, да и то – для того только, чтобы пояснить ее символ.
«Новый параметр» и объекты его приложения позволили выявить удивительную картину. Чтобы ее оценить, надо иметь в виду два обстоятельства. Во-первых, основу целочисленности составляют наиболее распространенные и стабильные изотопы атомов молекул 20 аминокислот. Второе обстоятельство требует отдельного уточнения. Дело в том, что молекулы аминокислот сконструированы по общему правилу. Все они являются альфа-аминокислотами, то есть их аминогруппа максимально приближена к карбоксилу; именно такие аминокислоты способны обеспечить необходимую прочность и устойчивость молекулам полимеров (полипептидов):
Различие в структуре аминокислот обеспечивается вариантами радикала (R), а константную часть молекулы составляют показанные здесь два атома углерода, два – кислорода, один – азота и четыре – водорода. Их целочисленная нуклонная масса, то есть масса их нуклонов – 74 в свободном состоянии и 56 – в составе полипептида. Вариабельная нуклонная масса относится к радикалу и составляет от 1 (водородный протон) у глицина G до 130 у триптофана W.
Единственное исключение из общей структуры аминокислот представляет собой пролин Р. Он содержит боковую цепь с двумя связями – и на один атом водорода меньше в константной части. Однако, воображаемая передача одного нуклона из боковой цепи – константной возвращает последней стандартную массу: 73+1=74, в то время, как боковая цепь остается без протона: 42—1=41. Одновременно пролину возвращается «стандартная» структура аминокислоты, состоящая из константной и вариабельной частей.
Остается отметить, что пунктуационный знак «стоп», не кодирующий аминокислоты (в отличие от знака «старт», ассоциированного с метионином М), принимается в оцифровке генетического кода за ноль. Примем также во внимание и то, что пять позиций:
оцифровка генетического кода сама по себе,
разделение молекулы аминокислоты на константную и вариабельную части для наглядности такой оцифровки,
знак «0», которым в арифметике (особенно там, где речь идет о представлении числа в той или иной системе счисления), помечают не столько «пустоту», сколько «пробел»,
«нормирование» молекулы пролина, показанное выше,
кодирование цистеина триплетами TGH в таблице универсального кода —
все это – действия совершенно искусственные, работа ума, артефакт, не имеющий, на первый взгляд, никаких «естественных» аналогов. Но именно на них основана оцифровка генетического кода, о которой пойдет здесь речь. Ее результаты заставляют думать, что перед нами либо следствие физических законов необычной природы, либо случайные совпадения, либо конструкция, собранная по принципам, для демонстрации которых такая оцифровка адекватна.
Попробуем это проиллюстрировать на примере, который Владимир Щербак назвал каллиграммой (Глава А). Представим эту каллиграмму чуть иначе, чем прежде, а именно «уравняем в правах» первый и второй октеты, то есть, придадим им одинаковый размер, для чего третьи основания кодонов в строке октета 1 представим как Y или R, а не как N. Одновременно впишем в дополнительные ячейки таблицы значения нуклонных масс продуктов кодирования, а также их константных и вариабельных частей, после чего просуммируем каждые (по горизонтали).
Результаты суммирования (как минимум!) озадачивают. Их можно свести к четырем пунктам.
В первом октете полученные числа формируют соотношение сторон так называемого «священного египетского треугольника» – [666+1184=1850], где 666=32х74, 1184=42х74, а 1850=52х74, то есть соотношение [32+42=52], или соотношение длин катетов и гипотенузы прямоугольного треугольника, соответствующих трем смежным числам, соседям по непрерывному натуральному ряду 3, 4, 5. (т. н. «Священный Египетский Треугольник»).
Во втором октете эти результаты формируют символ равенства или количественной симметрии: 1110=1110. При этом в строке var (нуклонные суммы вариабельных частей аминокислот) октета 2 показанный здесь результат достигается только тогда, когда пунктуационному знаку терминации трансляции (стоп-сигналу) соответствует пробел, ноль, 0, пустое место, о чем мы говорили выше.
Соотношение сумм строк var октетов 1 и 2 имеет вид 3 : 5 (666 : 1110), то есть двух смежных чисел ряда Фибоначчи, то есть, золотого сечения.
Наконец, все отмеченные суммации и соотношения выражены десятичными числами вида n111, либо обладают способностью делиться без остатка на простое число 37 (половине сомножителя 74, упомянутого в первом пункте и равного нуклонной сумме константного блока аминокислоты), которое соответствует делению 111: 3 и является наибольшим простым делителем числа 111.
Первые три пункта представляют собой соотношения, а в природе – особенно в живой – встречаются удивительные соотношения. Автор, правда, никогда не слышал о природном соотношении, которое описывают первый пункт и теорема Пифагора. Тем не менее, если, например, «золотое сечение» и ряды Фибоначчи, реализуемые филотаксисом, различные фракталы, циклы, симметрии, спирали, ритмы и прочее – могут быть и природными соотношениями, то четвертый пункт из вышеперечисленных демонстрирует метку этих соотношений, выраженную весьма специфическим знаковым рядом. Этот ряд представляет собой совокупность гомогенных цифровых триплетов (гомотриплетов, как мы их здесь называем), которые базируются на десятичной системе счисления с поразрядным представлением числа. Ничего подобного в природе не встречается. Ни один физический закон не требует для своей формулировки (включая ее математическое выражение) поразрядного представления числа. Этого нет даже в одном из наиболее упорядоченных и поразительных формальных представлений природных объектов – в периодической системе элементов. Что до поразрядного представления числа, то оно было в свое время предложено с единственной целью – для упрощения арифметических расчетов. Но в случае генетического кода понятие вычислительной мощи (которую оптимизирует именно система счисления) может быть использовано только в том случае, когда к функциям генома – или кода – добавляется также необходимость каких-то вычислений. В противном случае перед нами просто знак, метка, клеймо, тавро, опечаток какой-то очевидно интеллектуальной деятельности – или что-то в этом роде. Стоит помнить при этом, что предлагаемое учебниками табличное представление генетического кода – в отличие от последовательностей генома – представляет собой именно интеллектуальную, а не реальную структуру.
Здесь стоит вернуться к Главе 111 и вспомнить, что мы – согласившись с автомобилистами – назвали число 111 «красивым» и «привлекающим внимание». Число 37 внешне привлекает пусть и меньшее внимание, однако, оно не менее «интересно» и уникально в том, что пермутация любого трехзначного числа, способного делиться на 37, дает в результате три числа, также обладающие подобным свойством: 259?592?925 или 185?851?518 и т. п. Между прочим, итерация «вглубь нуклонов» напоминает, что 37 этих элементарных частиц собраны из 111 кварков. Мы также отметили, что повторяемость подобных чисел придает им свойство, называемое у программистов информационной сигнатурой. Но о каких «информационных сигнатурах» может идти речь в том, что создано природой? Кого и о чем надо при этом «информировать», и кому пришло в голову заниматься передачей такой информации – да еще в те далекие годы, когда формировался генетический код? О каких предпочтительных в природе системах счисления можно вообще говорить? Ответ, который напрашивается первым, вызывает только одну реакцию: вздор! совпадения! нумерология! Да и можно ли назвать «повторяемостью» три случайных числа в двух октетных строчках? Так что давайте успокоимся и убедимся, что таких чисел нет больше ни в каких представлениях генетического кода, и они действительно случайны. Тем более, что Автор – человек эмоциональный и должен себя сдерживать. Ведь на него сильное – и описанное выше в связи со знаменитой лекцией – впечатление произвела каллиграмма Щербака уже в аналоговом формате, описанном в Главе А.
Несколько других представлений генетического кода основаны на гораздо более изощренной и не всегда очевидной логике и не будут представлены здесь, поскольку это может перегрузить ум Читателя, который – при желании – самостоятельно проанализирует их в публикациях Щербака. Одно из них (в самом общем виде) подразделяет триплеты с идентичными и уникальными основаниями на две группы в соответствии с преобразованием Румера, после чего в этих группах подсчитывается суммарная нуклонная масса боковых цепей – с одной стороны, и общая нуклонная сумма полных аминокислот – с другой. Таким же образом суммируются нуклоны боковых цепей и целых молекул аминокислот, кодируемых триплетами с двумя идентичными пуринами или пиримидинами. Результатом постоянно оказываются значения вида n111.
Еще одно представление, которое предлагает Щербак для демонстрации n111-символики генетического кода, подчеркивает «общий виртуальный баланс кода». В этом представлении все продукты кодирования классифицируются по наличию того или иного азотистого основания в кодирующих их триплетах. Всех оснований в коде 192 (48С, 48Т, 48А и 48G). Предлагается разделить эти продукты по наличию в их кодонах основания Т – с одной стороны, и трех других (С, А и G) – с другой. В этом случае возникает баланс между нуклонными массами боковых цепей и стандартных блоков аминокислот, который выражается как 222+999х10 = 222+999х10.
Рассмотрим подробнее еще одну таблицу кода6060 61, основанную на совершенно иных принципах. Щербаком она приводится в виде кольца и иллюстрирует «общий естественный баланс универсального генетического кода». Мы, однако, представляем эту таблицу в виде линейной последовательности, поскольку «кольцевой пептид» – да еще такой длины в природе не встречается. Между тем, для нас важно выделить направление пептида, сохраняя и «конец», и «начало» внутри цепи. Константные части свободных аминокислот имеют массу 74, в то время, как в составе полипептида эта масса за счет поликонденсации снижается до 56. Вот почему мы представляем воображаемый минимальный полный пептид (МПП) генетического кода лишь как фрагмент некоего белка. Последовательность первых нуклеотидов является пермутацией упорядоченной по массе четверки (CTAG) – AGCT, сохраняющей исходную симметрию по комплементарности. Последовательность вторых нуклеотидов комплементарна (зеркально симметрична) последовательности первых: TCGA. Последовательность третьих нуклеотидов – пермутация последовательности вторых, но начинающаяся с пуринов (GATC) – в случае первых пуринов, и начинающаяся с пиримидинов (TCGA) – в случае первых пиримидинов. Именно такой порядок кодирующих МПП оснований соответствует реальному направлению кодирования – от стартового до терминирующего кодона:
В составе МПП пролин (выделен светло-серым) имеет реальные нуклонные массы своих частей – константной и вариабельной. Кроме того, в ней – как это имеет место в реальной клетке – полностью ионизированы аспарагиновая и глютаминовая кислоты и полностью протонированы аргинин и лизин. Что до гистидина, он в условиях клетки протонируется далеко не полностью, и его нуклонная масса остается в ней неизменной – 81.
Самой яркой чертой описываемого олигопептида является количественное равновесие нуклонных масс консервативных и вариабельных (боковых) частей составляющих его аминокислот: 3412=3412. Между прочим, это равновесие – с небольшими отклонениями – воспроизводится практически для всех природных белков. В то же время для случайного набора аминокислот масса боковых цепочек превышает массу «хребта» из константных частей примерно на 12%.
Может показаться, что эти числа, которыми выражаются общие и равные друг другу нуклонные массы боковых частей и стандартных блоков МПП (то есть результат оцифровки продуктов кодирования), ничем не примечательны. Во всяком случае, они не имеют вида n111, который до сих пор привлекал наше внимание. Однако, номера нуклеотидов упорядоченных по нарастанию молекулярных масс C <T <A <G, то есть 1234 (рациональность чего – для первых кодонных оснований – мы показали в Главе А), пермутированные в составе первых оснований, кодирующих МПП (3412), странным образом соответствуют нуклонным массам обеих частей этого пептида, выраженным в десятичной системе счисления: 3412=3412=3412. В порядке ещ? одного – математического курьеза отметим, что десятичное число 1234 в семеричной системе счисления записывается как 34127.
Рациональная организация кодирующей последовательности может, таким образом, указывать на ведущую роль первых триплетных оснований в симметриях кода. Снова и снова указывает она и на базовую роль молекулярных масс в организации не только кодирующих правил, но также и кодируемого продукта. Кроме того, она показывает возможность оцифровки не только кодируемых (как у Щербака), но и кодирующих элементов – и не только в терминах нуклонных масс, но также используя простую нумерацию.
Данный текст является ознакомительным фрагментом.