Глава 12 Гаплогруппа Н
Гаплогруппа Н, в отличие от гаплогрупп Е и G, тяготеет к Индии. Расчеты по снипам показали, что гаплогруппа Н образовалась примерно 48 тысяч лет назад[74], и древнейшие ветви ее находятся среди индийских дравидов.
Получить представление о древности общих предков гаплогруппы Н можно при рассмотрении рисунка, и даже не всего дерева, а только его двух плоских (то есть недавних) ветвей, базовые гаплотипы которых приведены в подписи к рисунку. Между ними 14 мутаций, что для ю-маркерных гаплотипов является астрономическим расстоянием. Общий предок их жил примерно 66 тысяч лет назад, но эта величина, определенная по двум коротким гаплотипам, получена с большой погрешностью.
Дерево из тридцати 10-маркерных гаплотипов гаплогрупп Н дравидов Индии. Построено по данным[75].
Левая плоская ветвь имеет базовый гаплотип 13 23 16 10 9 12 12 11 15 9, правая плоская ветвь внизу справа – 13 24 14 11 12 11 13 11 19 10.
Приведем несколько примеров, как среднее число мутаций на маркер в серии гаплотипов связано с древностью общего предка гаплотипов.
– В серии из 11 гаплотипов в 95-маркерном формате гаплогруппы А00 было найдено 29 мутаций (от предкового гаплотипа), что дает 29/11/95 = 0.0278 мутаций на маркер. Такая малая величина не требует поправки на возвратные мутации, и общий предок данной серии гаплотипов жил 425 ± 90 лет назад.
– В серии из 42 гаплотипов в 12-маркерном формате гаплогруппы С было найдено 40 мутаций (от предкового гаплотипа), что дает 40/42/12 = 0.0794 мутаций на маркер. Если (ошибочно) не вводить поправку на возвратные мутации, то общий предок жил (несколько заниженная величина) 40/42/0.02 = 48 условных поколений назад, то есть 1200 лет назад (погрешности для сокращения изложения здесь приводить не будем). Число мутаций на маркер с поправкой на возвратные мутации (см. формулу в соседней врезке) равно
то есть поправка равна 1.0413, и общий предок данной серии гаплотипов жил примерно 1200 х 1.0413 = 1250 лет назад. В данном случае поправка незначительная, всего около 4 %, и отсюда можно заключить, что 0.08 мутаций на маркер является величиной, выше которой вносить поправки на возвратные мутации уже необходимо.
– В серии из 193 гаплотипов в 67-маркерном формате гаплогруппы E1b-V13 было найдено 2857 мутаций (от предкового гаплотипа), что дает 0.221 мутаций на маркер. Если (ошибочно) не вводить поправку на возвратные мутации, то общий предок жил (заниженная величина) 2857/193/0.12 = 123 условных поколений назад, то есть 3075 лет назад. Число мутаций на маркер с поправкой на возвратные мутации равно
то есть поправка равна 1.1237, и общий предок данной серии гаплотипов жил примерно 123 х 1.1237 = 138 условных поколений назад, то есть 3450 лет назад.
– В серии из 470 гаплотипов в 111-маркерном формате гаплогруппы Е1b-М35.1 было найдено 27187 мутаций (от предкового гаплотипа), что дает 0.521 мутаций на маркер. Если (ошибочно) не вводить поправку на возвратные мутации, то общий предок жил (сильно заниженная величина) 27187/470/0.198 = 292 условных поколений назад, то есть 7300 лет назад. Число мутаций на маркер с поправкой на возвратные мутации равно
то есть поправка равна 1.3418, и общий предок данной серии гаплотипов жил примерно 292 х 1.3418 = 392 условных поколений назад, то есть 9800 лет назад.
Мы видим, что уже при 0.521 мутаций на маркер линейный метод расчета без учета поправки на возвратные мутации дает занижение датировок на треть.
Теперь становится ясно, что 1.4 мутаций на маркер – это астрономически большая величина в отношении поправки на возвратные мутации и времени жизни общего предка для двух ветвей дравидов гаплогруппы Н, поскольку число мутаций на маркер входит в экспоненциальный показатель формулы поправок. Более того, при подобных величинах числа мутаций на маркер формула становится вообще неприменимой, так как возвратные мутации в таких случаях проходят многократно вверх-вниз, и не входят должным образом в число мутаций на маркер. Поэтому следует применять квадратичную формулу, при которой поправки вообще не рассчитывают, они «встроены» в сам подход.
Квадратичный метод, в отличие от линейного, основан на подсчетах не мутаций от базового гаплотипа, а квадратов мутаций, по принципу «всех от всех» аллелей. Например, в серии из трех 12-маркерных гаплотипов
13 24 16 10 11 15 12 12 10 13 11 30
13 25 16 11 11 15 12 12 10 13 11 30
13 24 16 11 11 15 12 12 11 13 11 30
с базовым гаплотипом
1324 16 11 11 15 12 12 10 13 11 30
и тремя мутациями от базового гаплотипа (выделены), линейный метод дает 3/3/0.02 = 50 ? 53 условных поколения, то есть 1325 ± 780 лет до общего предка. Столь большая погрешность вызвана малым числом гаплотипов в серии, причем гаплотипов коротких, и малым числом мутаций. Расчет погрешности в данном случае проводится извлечением квадратного корня из трех (мутаций), что дает 1.732, далее его обратной величины (1/1.732 = 0.577), возведением ее в квадрат (0.5772 = 0.333), прибавлением 0.01 (это – квадрат принятой погрешности величины константы скорости мутации, которая принимается равной ± 10 %, то есть ± 0.1), что дает 0.343, и, наконец, извлечением квадратного корня из последней величины, что дает 0.586 (то есть ± 58.6 %). Это и есть величина погрешности определения времени до общего предка при трех мутациях в серии гаплотипов. При величине 1325 лет погрешность равна 1325x0.586, то есть ± 780 лет.
В квадратичном методе расчетов базовый гаплотип не рассматривается, и производится расчет разницы в аллелях «всех между всеми». В случае приведенных выше трех 12-маркерных гаплотипов с тремя мутациями сумма квадратов их попарных отклонений друг от друга (в мутированных маркерах) равна 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 + 12 = 12, деленная на 2, поскольку в каждом маркере число квадратов мутаций считалось дважды, деленное на число маркеров в гаплотипе (12) и на квадрат числа гаплотипов (9), и, наконец, на величину константы скорости мутации на маркер для 12-маркерных гаплотипов (0.00167). Получаем 12/2/12/9/0.00167 = 33 условных поколений, то есть 825 ± 480 лет до общего предка. В квадратичных методах расчетов поправка на возвратные мутации не вводится, она уже учтена самим методом расчета.
Как видим, мы имеем некоторую проблему. Линейный метод показал для этих трех гаплотипов с тремя мутациями 1325 ± 780 лет до общего предка, квадратичный метод – 825 ± 480 лет до общего предка. В принципе, обе величины находятся в пределах погрешности расчетов, но утешение от этого малое. Причина проста – три мутации на трех гаплотипах – это не статистика. Методы, описанные выше, базируются на статистическом распределении аллелей и мутаций в гаплотипах. Аналогия – если вы бросите монету три раза, или четыре для четности, то вероятность получения 50 %-ного выпадения орла и решки будет весьма малой.
Гаплогруппа Н с субкладами часто встречается в племенах индийских джунглей, хотя по понятным причинам таких данных относительно мало. Например, в южно-индийском племени Койя из 41 человек, тестированных на Y-хромосому, гаплогруппу H1 имели 25 человек, гаплогруппу F и человек, а гаплогруппу R1a – всего один человек[76]. Однако общий предок гаплогруппы H1 жил относительно недавно, так как из упомянутых 25 гаплотипов, которые были определены в 6-маркерном формате, и были идентичны друг другу, то есть были предко-выми гаплотипами. Остальные гаплотипы содержали 22 мутации. Это дает 22/25/0.0074 = 119 ? 128 условных поколений, или 3200 ± 750 лет до общего предка. Логарифмический метод расчета дает [ln(25/n)]/0.0074 = 111 ? 118 условных поколений, то есть 2950 ± 900 лет до общего предка, что сходно друг с другом в пределах погрешности расчетов.
В индейском племени Корагас все 28 человек, тестированные только на 5-маркерные гаплотипы[77], имели гаплогруппу H1, и них 10 гаплотипов были идентичны друг другу, то есть предковые, а остальные 18 гаплотипов имели 27 мутаций. Это дает возраст общего предка при расчете линейным методом 27/28/0.0081 = 119 ? 132 условных поколений, то есть 3300 ± 720 лет до общего предка, и логарифмическим – [ln(28/10)]/0.0081 = 127 ? 143 условных поколений, то есть 3575 ± 1180 лет до общего предка, что сходно друг с другом в пределах погрешности расчетов.
В Европе наиболее заметная группа носителей гаплогруппы H1 – это цыгане, или, как их называют на Западе – рома. Болгарские цыгане имеют общего предка 550 ± 100 лет назад[78], хорватские цыгане – 1100 ± 250 лет назад[79].