1.2. Инструментарий геногеографии
§1. Генетические маркёры: Как их изучают: экспедиции, ДНК и анализ - Наследование аутосомных маркёров и однородительских - Полиморфизм генов и их рекомбинация - Отсутствие рекомбинации: гаплотипы, гаплогруппы - Как ошибки переписчиков рождают новые гаплотипы - Типы генетических маркёров
§2. Карты: Как по одной таблице сделать два противоположных вывода - Чем карта лучше таблицы - Как было написано первое письмо - Когда карта показывает больше сведений, чем на неё нанесли - Частота признака на разных территориях - Цифровые карты - Пространство, разложенное по ячейкам - Расселение человека дискретно - Но его карта непрерывна - Как «цифровую» карту сделать «видимой» - Стереть случайные черты...- Трендовые карты §3. Опрос очевидцев: Много очевидцев одного события — Много субъективных мнений объективнее одного - Многоочий или мультиокулярный? - Комплексный анализ - Уже наполовину синтез - Необходимость карты - Много простых карт и одна обобщённая - Каждой науке по обобщённой карте - Обобщая обобщённое - Как прогресс ДНК технологий постепенно приближал нас... к уже известному - Перспективность однородительских или надёжность аутосомных - Карты прошлого - Новые виды обобщённых карт §1. Генетические маркёрыМы уже говорили о том, что изучение отдельных генов - не цель геногеографии, а только средство для достижения главной цели: изучения генофонда. Но без этого средства не обойтись. В этом разделе кратко рассматриваются разнообразные типы генов, которые используются в геногеографии. КАК ИЗУЧАЮТ ГЕНЕТИЧЕСКИЕ МАРКЁРЫ Изучение генов трудоёмко - оно требует намного больших затрат времени и средств, чем, например, изучение антропологического состава населения. Для того чтобы изучить ДНК маркёры (а именно ими интересуется сейчас популяционная генетика человека), надо сначала выехать в экспедицию и обследовать популяцию. При изучении коренного населения (а именно на него ориентирована мировая популяционная генетика), для каждого обследуемого составляется краткая родословная. Ведь надо собрать образцы венозной крови лишь у тех индивидов, которые не связаны между собой родством и достойно представляют свою популяцию: все предки обследуемых на протяжении двух поколений должны относиться не только к данному народу, но и к данной региональной популяции. Если учесть, что образцы крови берутся сейчас только у мужчин (чтобы одновременно в одной и той же выборке изучать все генетические маркёры, в том числе Y хромосомы) и каждый подписывает свое информированное согласие на обследование, то ясно, что экспедиционная работа становится нелёгким этапом в изучении генетических маркёров. Образцы крови, хранящиеся на холоде, срочно доставляются в молекулярно-генетический центр. Там из крови выделяется ДНК - достаточно хлопотное, трудоёмкое и дорогое занятие. Особенно, если ДНК выделяется теми методами, которые обеспечивают максимальную очистку ДНК от примесей и поэтому долгосрочное хранение ДНК коллекций. После этого ДНК уже может спокойно храниться в морозильных камерах. И начинается третий, самый интересный, но и самый длительный, разнообразный и дорогостоящий этап - определение у каждого индивида тех вариантов генов (или точнее - вариантов ДНК), по которым одни популяции отличаются от других. Этот чисто технический процесс, требующий, однако, высокой квалификации и обширных познаний, приводит к выявлению ДНК полиморфизма изучаемых популяций. Причём нельзя ограничиться одним или несколькими генами - для полноценного изучения генофонда панель анализируемых генов должна быть велика и разнообразна. Уже сейчас есть технологии, которые позволяют одновременно выявлять полиморфизм сотен и даже сотен тысяч генов. Однако эти технологии слишком дороги для большинства (в особенности - российских) лабораторий, которым приходится довольствоваться иными, весьма трудоёмкими методиками и ограничиваться изучением полиморфизма десятка, а не сотен генов. Впрочем, корректность выбора популяций часто оказывается важнее числа изученных генов, и даже по немногим генам удаётся выявить устойчивую структуру генофонда. Именно из-за большей сложности изучения генетического полиморфизма (от сбора образцов крови до дорогостоящего анализа) данные по распространению генов обычно охватывают куда меньшее число популяций, чем данные по антропологии или же по частоте встречаемости фамилий (которые также служат источником знаний о генофонде и подробно обсуждаются в главе 7). Однако лишь генетические маркёры несут прямую информацию о генофонде. АУТОСОМНЫЕ И «ОДНОРОДИТЕЛЬСКИЕ» От каждого из родителей мы получаем по одному «комплекту» генов - потому-то каждый ген имеется у нас в двойном наборе. Такие гены, один из которых получен от отца, а другой - от матери, называют «аутосомными». Практически все гены относятся к аутосомным. Однако есть и малые, но важные для изучения истории человека, исключения - это гены, переданные только от одного из родителей, и потому именуемые «однородительскими» (uniparental). Иными словами, комплекты генов, переданных от каждого из родителей, оказываются не совсем полными и идентичными друг другу. Только мужчины и только от отца получают Y хромосому. У женщин её нет. Только от матери все мы получаем ДНК, содержащуюся в митохондриях клетки. Митохондрии передаются потомкам только от матери с яйцеклеткой, содержащей всё необходимое для начала развития нового организма. Сперматозоид приносит от отца практически только ядро с наследственной информацией - митохондрии он не передаёт новому организму. Поэтому и мужчины, и женщины имеют митохондриальную ДНК (мтДНК), полученную ими от матери. Но следующему поколению передают мтДНК только женщины - на мужчинах цепь передачи информации митохондриальной ДНК как бы обрывается. Поэтому, если число потомков в какой-то родословной вдруг оказывается невелико, и на свет появятся только мальчики - вся длиннейшая цепь передачи информации мтДНК из глубины тысячелетий оборвётся, и никогда уже не будет восстановлена. Впрочем, цепь обрывается и тогда, когда на свет появляются только девочки - в этом случае обрывается цепь передачи Y хромосомы. Для аутосомных генов такая угроза утраты информации намного меньше. Если гены человека представить как слова универсального языка человеческой наследственности, то геном (или генотип) каждого из нас, включающий и аутосомные, и однородительские гены - это особый неповторимый текст, составленный на этом языке. Тогда генофонд популяции представляет собой на каждый конкретный момент времени совокупность индивидуальных текстов. Генофонд всей популяции содержит весь «словарный запас» данной популяции, из которого в каждом поколении черпаются слова и строятся новые индивидуальные тексты. «Тексты» велики, их разнообразие огромно и обеспечивает биологический фундамент неповторимости человеческой личности. ПОЛИМОРФИЗМ Популяционная генетика занимается полиморфными генами - то есть такими генами, которые встречаются в популяциях не в одном, а в разных вариантах (аллелях). Каждый из аллелей является результатом тех или иных мутаций гена, происшедших обычно в далёком прошлом и передающихся в цепи поколений. Причём для целей популяционной генетики важно, чтобы эти варианты не были очень редкими - согласно разным критериям полиморфизма, аллели полиморфного гена должны встречаться в популяции с частотой не менее 1% или даже 5%. У полиморфного гена семейство таких аллелей может быть самым разным по величине. Если оно минимально - всего два аллеля - гены называются диаллельными. Если же семейство аллелей очень велико - мультиаллельными. Но сколь бы ни было велико семейство аллелей, каждый отдельный человек в своём тексте не может содержать больше двух вариантов одного слова (два аллеля одного гена): один он получает от матери, и один - от отца. Если полученные аллели данного гена оказались одинаковы, то человек гомозиготен по данному гену. Если аллели отличаются друг от друга - то человек гетерозиготен по данному гену. Соотношение в популяции гомозигот и гетерозигот по множеству генов служит очень ценной характеристикой генофонда - уровня его гетерозиготности (о важности этой характеристики см., например, [Алтухов, 2003]). Все мы знаем, что дети, к счастью, не являются ни копией друг друга, ни лишь одного из родителей: мы говорим - глаза отцовские, а характером весь в бабушку. Почему в каждом из детей уникальным образом сочетаются полиморфные гены, передаваемые в поколениях? Потому что при передаче в следующее поколение разные аутосомные гены ведут себя независимо друг от друга. Одному из детей отец передаст один из своих аллелей, другому - другой, а какой из них отец получил от своего отца, а какой от своей матери - это уже равновероятно и при передаче собственным детям не имеет значения. Аутосомных генов много, и каждый раз при передаче в поколениях они «перетасовываются». Поэтому сочетание аллелей у каждого из детей окажется неповторимым. Но такой процесс рекомбинации происходит только с аутосомными генами. Можно представить себе весь передаваемый генетический «текст» в виде многих томов личной библиотеки. Получил человек в наследство от отца и от матери по полному собраний сочинений: скажем Марка Твена от отца и Агаты Кристи от матери. Пусть каждое собрание состоит, например, из ста томов-генов. Теперь подрос его собственный ребенок. И что отец оставляет ему в наследство? Не глядя, берет, скажем, 1 и 2 тома из отцовского Марка Твена; 3, 4 и 5 тома - из материнской Агаты Кристи, 6, 7 и 8 том - снова Марк Твен, а 10 - Агата Кристи, и так далее в совершенно случайном порядке. Ребенок получит от отца, как ему и положено, сто томов собрания сочинений, но вот какие тома будут из Марка Твена, а какие из Агаты Кристи - неведомо. От матери ребенок получит тоже сто томов, но в нём будут в столь же случайном порядке представлены тома из сочинений Карла Маркса и Иоанны Хмелевской. Своим детям он оставит в наследство вновь библиотеку из положенных ста томов, но в ней будут случайно чередоваться произведения Карла Маркса, Агаты Кристи, Марка Твена и Иоанны Хмелевской. Библиотека следующего поколения будет еще более пестрой. ГАПЛОГРУППЫ. ГАПЛОТИПЫ С однородительскими маркёрами рекомбинации не происходит - ведь дети получают генетическую информацию только от одного из родителей. Поэтому и весь генетический текст, записанный в митохондриальной ДНК или нерекомбинирующих участках Y хромосомы, они целиком передают потомству. Так целиком всё собрание сочинений однородительских маркёров, том к тому, передаётся от отца к сыну, а от матери - дочерям. Этот генетический текст (полное собрание сочинений) называют гаплотипами мтДНК и Y хромосомы. Но сразу возникает вопрос. Если эти гаплотипы передаются неизменными во всей чреде поколений, то все ли дочери Евы одинаковы? Разве у всех одинаковые «библиотеки» мтДНК? Откуда же берётся полиморфизм, различия по гаплотипам мтДНК? Чтобы ответить на этот замечательный вопрос, напомним, что прежде, чем передать потомкам генетический текст, его сначала отдают в «переписку». Ведь если у Вас четырнадцать детей. Вы каждому должны оставить в наследство свою генетическую библиотеку? Переписчики очень старательны, но время от времени в долгой чреде поколений случаются и ошибки. Выпала страница из книги. Или как у Гофмана, перепутались странички сочинений кота Мурра и его хозяина. Всякое может случиться. Но следующие переписчики этого не ведают - они переписывают всё подряд из того, что им досталось в наследство. Поэтому в чреде поколений передаются неизменными эти «ошибочные» странички. Но, конечно же, эти «ошибочные» странички есть только у многочисленных потомков того индивида, у которого произошла данная «ошибка». У других этой «ошибки» нет, но могут быть иные «опечатки». Так, потомки каждого из индивидов, отмеченного «опечаткой», отличаются от потомков иных индивидов. Такие линии передачи генетической информации называются «линиджами» (lineage), и в каждой из них постепенно накапливаются свои собственные ошибки. Настоящие рукописи именно так различаются и датируются - можно сравнить и определить, к какому «изводу» относится старинная рукопись по наличию характерных разночтений и ошибок, копируемых от переписчика к переписчику. Такие группы родственных гаплотипов, собранных в «линиджи» той или иной степени протяженности, объединяют в гаплогруппы. Каждая гаплогруппа состоит из «куста» родственных линиджей, в разной степени разветвлённого. Да и гаплогруппы подразделяются на разные иерархические уровни (см. главы б и 9). В целом, картина похожа на генеалогическое древо древнего и знатного рода. Но она намного проще - для мтДНК записывается в этом генеалогическом древе происхождение только по материнской линии (от Евы ко всем её нынешним дочерям), а для Y хромосомы - записывается генеалогия только по отцовской линии (от Адама - ко всем его нынешним сыновьям). Много проще она и тем, что записываются на генетическом древе не имена, а только мутации («ошибки переписчиков»), а они случаются нечасто. Зато корни генетического древа уходят на огромную глубину - на все время существования человечества. ТИПЫ ГЕНЕТИЧЕСКИХ МАРКЁРОВ В следующем разделе мы даём краткую справку о разных типах генетических маркёров. Поэтому здесь мы обрисуем лишь общую картину. Сейчас принято молекулярно-генетические маркёры, изучаемые при прямом анализе ДНК. называть ДНК маркёрами. Все остальные признаки, с которыми работала популяционная генетика до «ДНК эры», стали называть общим именем - «классические генетические маркёры». Такое деление удобно. Среди классических маркёров (см. подробнее также главу 5, им посвященную) выделяются три основных подтипа, которые перечислим в «историческом» порядке их использования. 1) Физиологические маркёры - те физиологические признаки, проявление которых контролируется одним геном. Например, цветовая слепота, вкусовая чувствительность к фенилтиокарбамиду или тип ушной серы. 2) Иммунологические маркёры - белки иммунной системы, определяемые иммунологическими (серологическими) методами. Например, всем известные группы крови АВ0 и резус. 3) Биохимические маркёры - ферменты (обычно сыворотки или эритроцитов крови), определяемые биохимическими методами, такими как электрофорез и изоэлектрофокусирование. ДНК маркёры, используемые в популяционной генетике, имеют несколько разных критериев классификации (см. раздел 1.3.). И поэтому эти классификации перекрываются друг с другом. Мы уже говорили, что есть аутосомные маркёры, а есть однородительские (мтДНК и Y хромосомы). Но среди и аутосомных генов, и среди однородительских есть и диаллельные маркёры, и мультиаллельные маркёры. Среди диаллельных ДНК маркёров обычно выделяют три типа: «точечные» замены (их обычно называют «снипы», то есть SNP - single nucleotide polymorphism, однонуклеотидный полиморфизм); инсерции (например, вставки мобильных элементов - Alu-повторы); делеции (например, см. раздет 6.1, где описывается распространение делеции в гене CCR5. определяющей устойчивость к СПИДу). Из мультиаллельных ДНК маркёров в популяционной генетике кроме таких, например, систем как HLA (гистосовместимости), самой природой нацеленных на максимальный полиморфизм, обычно изучают минисателлитные и микросателлитные (STR - short tandem repeats) маркёры. Эти маркёры любопытны тем, что аллели одного гена отличаются друг от друга просто количеством повторов одного и того же «мотива»: только у минисателлитных маркёров «мотив» подлиннее, а у микросателлитных состоит из сочетания всего нескольких букв, но это сочетание многократно и монотонно повторяется. Мутации в этих маркёрах накапливаются довольно быстро - просто на один повтор становится больше или меньше. Именно благодаря такой повышенной скорости мутаций эти маркёры и важны - их используют как «минутную» стрелку при датировке гаплогрупп Y хромосомы, а медлительные «снипы» - как «часовую» стрелку. Мы видим, что отнесение к одному из подтипов классических маркёров или же к ДНК маркёрам целиком определяется технической стороной, например, методом тестирования гена. Суть всех генетических маркёров едина: в результате того или иного метода тестирования (показываем ли книжку с цветными картинками для определения цветовой слепоты или же проводим секвенирование ДНК, выявляя точную последовательность нуклеотидов) мы по результату тестирования однозначно определяем наличие или отсутствие у человека конкретных аллелей конкретного гена. Поэтому определяемые признаки и называются «маркёрами» гена, генетическими маркёрами - потому что они прямо и совершенно однозначно указывают на этот ген, маркируют этот вариант ДНК. Почему мы это подчёркиваем? Оттого, что порой сталкиваешься с тем, что к генетическим маркёрам относят просто признаки с большой долей наследственной компоненты - например, цвет глаз или признаки кожных узоров. Это неверно. Как бы ни был велик вклад наследственности, но если мы не можем однозначно указать, какие именно гены стоят за данным фенотипом, каков точный тип наследования, мы не имеем права называть эти фенотипические признаки генетическими маркёрами. Только однозначное определение аллелей генов, стоящих за данным фенотипом, позволяет отнести признак к генетическим маркёрам. Подобная ситуация и с квазигенетическими маркёрами (глава 7). Но к ним относят те маркёры, у которых никто и не подозревает «генетическую предрасположенность» - например, фамилии, название рода, демографические параметры. Всем сразу ясно, что эти признаки не имеют не только генетической, но и биологической природы. Поэтому честно и заявляется, что они квазигенетические, то есть «псевдогенетические». Однако, несмотря на такой «псевдоним» и то, что они не определяются генами (фамилия - явление языка и культуры, а не биологии), квазигенетические маркёры порой себя ведут почти так же, как и настоящие гены - и даже благодаря истории иногда оказываются в одной связке с генами. Такая связь между фамилиями и генами рассмотрена в 7 главе, посвященной фамилиям. §2. КартыГеографию занимают бесплотные и долговечные души земного мира, а не наполняющие его плотные, но тленные вещи. Б. Б. Родоман ДОСТОИНСТВА КАРТ Речь пойдёт о главном рабочем инструменте этой книги - компьютерных картах, показывающих, какова вероятность встретить тот или иной признак в любой точке изученного ареала генофонда. Конечно же, бесконечное генетическое разнообразие человека сложно охватить и представить даже в самых общих чертах - основная часть нашего наследственного полиморфизма выражается в нашей индивидуальности, в неповторимости каждого из нас, в бескрайней многоликости человечества. И всё же даже на бытовом уровне осознания мы умеем среди этой многоликости выделять некие общие популяционные черты и порой идентифицировать даже единичных представителей разных популяций, народов и регионов. Науки о биологии человека антропология, генетика - различают популяции не интуитивно, а с помощью объективных мер. Оценивая количественно самые разные признаки антропологического покрова (измеряя тело, голову, лицо, оценивая в баллах форму носа, цвет глаз или рост бороды) и генетического фундамента (частоты встречаемости в популяции разных вариантов самых разных генов), мы объективно фиксируем черты «портрета» данной конкретной популяции. Но когда надо охватить сразу множество таких популяционных портретов - здесь уже не хватает нашего воображения. И тогда на помощь приходит компьютерная картография. Карта - уникальный способ передачи и обобщения информации. Благодаря ей, мы можем своими глазами увидеть всё разнообразие отдельного признака на огромной территории. Но самое главное, что этот образ не будет результатом нашего индивидуального - и неизбежно субъективного - обобщения. Опыт показывает, что даже специалисты очень высокого класса, обобщая табличные данные без карты, приходят порой к совершенно разным выводам! Все мы видим по-разному, в зависимости от опыта, силы воображения, накопленных знаний и порой неосознаваемых нами установок. Компьютерная карта позволяет избежать субъективности, позволяет не только создать объективный и математически точный образ пространства, но и передать его без искажений всем читателям карты. И тогда уже опыт, воображение и обширные познания пригодятся при интерпретации карты, позволяя всем её читателям на одном языке обсуждать пространственную изменчивость населения. КАРТОГРАФИЯ Карта, по-видимому, древнее письменности. И это не удивительно, ибо язык карты универсален. Он был понятен разным племенам и носителям разных культур, объединял людей, говорящих на разных языках. И до сих пор он не утратил эту функцию - на языке карты могут общаться и полноценно сотрудничать специалисты разных отраслей знания, даже столь отдалённых, как генетика, антропология, лингвистика, археология. Картографирование столь разных признаков (цвета волос, частоты гаплогруппы митохондриальной ДНК, встречаемости костей мамонта на стоянках древнего человека) относится к одной науке — тематической картографии. Поэтому - при условии использования общей системы основных концепций, моделей и технологий - карты признаков генетики, антропологии, лингвистики, археологии становятся принципиально сопоставимы. А анализ общих закономерностей, выявляемых этими картами, может быть поставлен на строгую научную и математическую основу. КАРТА - СПОСОБ ОТОБРАЖЕНИЯ ИЛИ СРЕДСТВО АНАЛИЗА? В современной картографии существуют две основные концепции. Первая парадигма - коммуникативная. Она рассматривает картографию как отрасль информатики, науку о передаче графической информации, а карту — как особый информационный канал. В центре её внимания - процесс восприятия и качественной передачи информации. задача уменьшения потерь информации в канале связи. Вторая парадигма - гносеологическая. Согласно ей картография рассматривается как наука о познании окружающей действительности с помощью картографического моделирования, а сами карты служат образно-знаковыми моделями действительности. Ядро гносеологической парадигмы составляют проблемы отражения природных и социальных геосистем, картографического синтеза, научной генерализации, картографического метода изучения закономерностей. Таким образом, при первом подходе карты рассматриваются как канал передачи уже накопленной информации, при втором - как метод познания действительности, добывающий новые сведения об объекте картографирования. Мы в своей работе исходили из второй парадигмы. Подход к картам только как к каналу информации резко сужает возможность исследования явлений природы и общества, поскольку при этом постулируется, что информация, считываемая с карты, не может превышать количество исходной информации. При этом исчезает сам феномен карты, которая в действительности определяется не только и не столько объёмом знаковой информации, сколько пространственными соотношениями между картографированными объектами. Картографическое моделирование позволяет провести анализ пространственных закономерностей в изменчивости отдельных признаков и геосистем в целом. Карта, как образно-знаковая модель действительности, является носителем информации и служит инструментом формирования и приобретения новых знаний о пространственно-временных связях картографируемых явлений [Берлянт, 1986; Салищев, 1990]. Картографическую модель от других носителей информации отличает создание картографического образа, в котором присутствуют взаимное расположение и иные пространственные отношения картографированных объектов и явлений. КАРТА КАК МОДЕЛЬ Рассмотрение карты не как иллюстрации, не как справочного пособия, не как наглядной сводки данных, а как модели действительности, создающей новую информацию о картографируемых явлениях, - вот что лежит в основе картографического моделирования всех - столь разных! - признаков в данной книге. В зависимости от параметров моделирования на основе одних и тех же исходных данных можно создать целое семейство моделей. И с помощью моделирования мы можем перейти к активному эксперименту, объективно сравнить разные подходы и теории. Картографическая модель — не мёртвое изображение, а рабочая гипотеза, позволяющая провести как строгую математическую, так и экспертную проверку. Кратко сформулируем принципы картографического моделирования. 1) Количественное представление признаков. Значительную часть признаков можно охарактеризовать частотой их встречаемости в конкретной популяции. Такая частота означает вероятность встретить данный признак на данной территории. Качественные признаки антропологии представляются также в количественном виде - в баллах. 2) В основе карты — цифровая модель. Это центральный элемент нашей картографической технологии. В каждой точке карты находится число - значение признака. Такое представление данных позволяет обращаться с картой не как с иллюстрацией, а скорее как с таблицей, точнее, как с матрицей данных - например, проводить разнообразные вычисления, количественно сравнивать разные карты и многое другое. На карту как бы накинута густая равномерная сеть. В каждом узле сети находятся цифровые значения признака. Например, на картах Восточной Европы такая сеть насчитывает более 9000 узлов, и в каждом из них - рассчитанное нами значение картографированного признака. Цифровая модель карты — это двумерная матрица, позволяющая проводить все виды математической обработки. 3) Непрерывность картографического распределения. В обоснование этого принципа лишь процитируем Ж. П. Дюшмена: «Хотя расселение дискретно, освоение пространства человеком непрерывно» [Дюшмен, 1983]. Картографируя освоенное человеком пространство, мы с необходимостью переходим от дискретности исходных данных к непрерывному распределению карты. Для каждой точки карты мы получаем вероятностную характеристику популяции - даже если поблизости от этой точки в данный момент времени нет ни одного постоянно проживающего человека. Именно так мы переходим от дискретно расположенных населённых пунктов к непрерывному ареалу популяции. 4) Интерполяционная процедура картографирования. Между точками с исходными значениями признака (мы их называем «опорными» точками) интерполируется градиент этих значений, то есть значения признака в промежуточных точках прогнозируются согласно заданной математической процедуре. За пределами изученных областей проводится экстраполяция (по той же процедуре) градиента значений признака. Прогноз строится не по соседним точкам, а по всем опорным точкам в пределах радиуса в сотни километров. На карте градиент значений визуализируется с помощью изолиний. При этом мы постулируем отсутствие непреодолимых границ между группами населения. Такие границы в освоенном человеком пространстве сомнительны даже при одномоментном временном срезе очень малой территории. При охвате же больших ареалов и. следовательно, целого слоя времён, сформировавших генофонд в этом ареале, нивелируются частные события истории: мы как бы усредняем множество изменчивых границ в пределах всего хронологического среза. Поэтому для моделирования динамики явления не годятся ни значковые карты (когда в центре ареала популяции помещается значок с фиксированным значением признака), ни широко распространённые карты качественного фона (весь ареал популяции заливается одним и тем же фиксированным значением признака: на этих картах смежные ареалы залиты каждый своим значением признака, как бы предполагая неприступные для человека и его генофонда «заборы»). Если же какое-то пространство действительно непреодолимо, и такие границы существуют, то они проявятся и на интерполяционных картах, опровергая «нулевую» гипотезу изоморфного пространства. Например, Атлас генофонда народов Кавказа был создан нами без учёта каких бы то ни было географических препятствий для потоков генов. Карты были построены в предположении изоморфности пространства. Процедура построения карт не накладывала никаких ограничений — интерполяция шла равновероятно и в сторону непроходимых гор, и в направлении оживлённых торговых путей. Однако сами генетические различия между популяциями уже содержали информацию об интенсивности потока генов в том или ином направлении. Поэтому на «синтетических» обобщённых картах мы к своему изумлению увидели резкий перелом, перепад значений, который полностью вторил своими изгибами Большому Кавказскому хребту (см.рис. 10.2.2. в главе 10). Большой Кавказ проявился на генетических картах благодаря реальным различиям между генофондами, то есть объективно, а не по причине заложенных нами в технику построения карт препятствий для потока генов. 5) Генерализация карты. Генерализация карты - это обобщение. выделение основных черт карты, при этом степень генерализации может быть разной и должна соответствовать масштабу исследования. Эпиграфом генерализации можно было бы взять слова А. Блока «Сотри случайные черты - и ты увидишь...». Согласно модели Мерке, вероятность создания правильного картографического образа, отражающего пространственные закономерности карты, обратно пропорциональна насыщенности исходной информацией. Карта исходных данных перегружена историческими случайностями, и генерализация карты — это не сворачивание, а «проявка» истинной информации. В качестве «бесстрастной меры» для генерализации карты мы использовали метод выделения трендов. Тренд - это основные тенденции пространственных распределений, общие и региональные черты рельефа карты. Из множества реализованных нами вариантов построения трендовых поверхностей в данной книге использованы методы выявления тренда путем осреднения в скользящем окне заданного размера и моделирования сквозного тренда в предположении распространения признака из единого центра. Краткое описание методов приводится в Пргаожении. Использование трендовых моделей (а не исходных карт) принципиально при анализе динамики на значительных пространствах и мощных хронологических пластах. Конечно же, любая картографическая модель - это всего лишь один вариант из множества возможных моделей распространения признака. Но важно то, что он полностью воспроизводим, объективен, и доступен столь же однозначной и воспроизводимой коррекции. Более того, мы обычно создаём не одну, а множество таких картографических моделей, варьируя их параметры - и тогда серия карт распространения одного и того же признака позволяет увидеть его «объёмно» и отделить устойчивые черты от случайных. Способ построения карт, их разновидности, картографические технологии подробно описаны в Приложении, к которому читатель может обратиться в любой момент, когда созреет вопрос о том, как были созданы рассматриваемые им многочисленные картографические модели. §3. Опрос очевидцевТебе дано бесстрастной мерой Измерить все, что видишь ты. Твой взгляд — да будет твёрд и ясен — Сотри случайные черты — И ты увидишь — мир прекрасен. Александр Блок Вопрос объективности получаемого «портрета» генофонда является решающим. Каждая наука, каждый тип признаков субъективны - каждый видит генофонд по-своему. Как же найти реально существующую структуру генофонда среди разнобоя мнений очевидцев? Одним из главнейших средств выявления объективного «портрета» генофонда является параллельный анализ одного и того же генофонда по разным типам признаков. Разные типы признаков - классические и ДНК маркёры генетики, антропологические признаки, фамилии и даже археологические характеристики - несут в своей изменчивости информацию о генофонде. А картографическая технология геногеографии позволяет сделать эту информацию явной. Множество типов признаков современная геногеография рассматривает как множество очевидцев одних и тех же событий в истории генофонда. Поэтому и совместный анализ этого множества данных мы предлагаем называть многоочевидческим, а проще - многоочим подходом (для нынешней научной терминологии, увы! - привычнее калька «мультиокулярный», нежели «многоочий»). Этот подход действительно мультиокулярный, потому что позволяет исследователю не ограничиваться лишь взглядом на генофонд через единственную призму выбранного типа признаков. Такой подход позволяет исследователю смотреть на генофонд одновременно глазами самых разных признаков. Тем самым мультиокулярный подход дарит недоступный раньше уровень объективности и независимости от случайностей, свойственных анализу отдельного типа признаков. Именно такой подход - совместного использования данных разных наук для объективного изучения русского генофонда - положен в основу нашего исследовании. Синтез данных антропологии, этнологии, археологии, лингвистики и генетики для изучения истории и пространственной изменчивости генофонда столь же необходим, сколь и сложен. Если ранее обмен информацией мог идти только по пути косвенного сопоставления выводов и гипотез каждой из наук, то теперь, благодаря развитию компьютерных картографических технологий, можно перейти к прямому сопоставлению самих данных разных наук, к их комплексному анализу. СТРАТЕГИЯ КОМПЛЕКСНОГО ИЗУЧЕНИЯ ГЕНОФОНДА Технологии геногеографии позволили разработать мультиокулярный (многоочий, полисистемный) подход к изучению генофонда. Он состоит в прямом - качественном и количественном - сопоставлении тех картин мира, которые дают разные науки, разные типы признаков, то есть разные очевидцы одних и тех же явлений. Провести такое прямое сравнение можно только через анализ карт, построенных и анализируемых строго одними и теми же технологиями. Такие карты позволяют выявить основные тенденции в пространственной изменчивости населения и обойти основное препятствие - различную изученность населения по разным типам признаков. Иными путями это препятствие непреодолимо - набор изученных популяций просто несопоставим. Например, для Восточной Европы не оказалось ни одной популяции, изученной по всему спектру анализируемых нами генетических маркёров (глава 8). И это в пределах лишь одного раздела науки! Что же говорить о совсем разных признаках - фамилий, антропологии или ДНК маркёров? А ведь многомерные методы статистики требуют, чтобы все популяции были изучены по всем признакам. В нашей книге представлены первые результаты мультиокулярного подхода. В этой широкомасштабной работе участвовали ведущие специалисты в каждой отрасли науки: А. П. Бужилова, Р. Виллемс, Л. В. Грехова, В. Е. Дерябин, Н. А. Долинова, В. А. Спицын, Г. Л. Хить и многие другие. Например, для народов Восточной Европы (подробно эти результаты рассматриваются в главе 8) анализировались четыре типа признаков - ДНК маркёры, классические маркёры, соматология, дерматоглифика. Для каждого типа признаков одним и тем же способом были построены карты отдельных признаков и главных компонент. Все типы признаков резко различались и по числу изученных популяций, и по числу изученных признаков. Однако, несмотря на это, карты первых главных компонент каждого из четырёх типов признаков продемонстрировали одну и ту же картину, один и тот же паттерн изменчивости. Эту «общую модель» можно описать как встречу «запада» и «востока»: в целом на всех картах изолинии следуют меридианам. Какие можно сделать выводы? Если четыре независимых свидетеля дают одни и те же показания, то можно быть уверенным, что мы обнаружили ту реальную архитектонику генофонда, которая пробивается сквозь все несовершенства наших исследований. Эти и подобные исследования других генофондов позволили предложить стратегию комплексного изучения генофонда: 1) На первом этапе одним и тем же методом строятся карты отдельных признаков для каждого типа признаков. 2) На втором этапе - создаются обобщённые карты каждого типа признаков 3) На третьем этапе - проводится мультиокулярный (многоочий) анализ всех типов признаков. Его итогом является сравнение и геногеографический синтез данных разных наук: выявление искомой «общей модели» генофонда - тех структурообразующих элементов, которые проявились на картах большинства типов признаков, засвидетельствованы большинством очевидцев. 4) После выявления «общей модели» можно перейти к следующим этапам и, например, рассмотреть, что нового внёс каждый тип признаков в описание структуры населения, каковы особенности отдельных признаков при описании различий между популяциями. Намного забегая вперед, перечислим всё же некоторые аспекты и выводы мультиокулярного анализа. ПРОГНОЗ ДЛЯ ДНК МАРКЁРОВ Выявленное сходство между картинами мира антропологии и генетики позволяет сформулировать вывод о том, что данные антропологии (а это фенотипические признаки - например цвет глаз, рост бороды или же кожные узоры) отражают реальную структуру генофонда. Из этого следует неординарный вывод: именно обобщённые карты антропологии, благодаря чрезвычайно широкому спектру изученных популяций, являются эталонными и обладают предсказательной силой для молекулярной генетики (а вовсе не наоборот!). Этот тезис был проверен экспериментально. В первом варианте картографирования аутосомных ДНК маркёров карта первой компоненты изменчивости генофонда Восточной Европы по своему общему паттерну соответствовала картам антропологии и классической генетики, но с одним существенным отличием: экстремум на «ДНК-карте» был явно смещён на северо-восток. Однако когда и число изученных ДНК маркёров, и число изученных популяций возросло почти вдвое, новый вариант карты по ДНК маркёрам значительно приблизился к картам антропологии (см. главу 8). Можно надеяться, что когда по ДНК маркёрам будут изучены не 30 популяций, как сейчас, а те же 600 популяций, что и по антропологии, то их карты совпадут полностью. Таким образом, молекулярная генетика не меняет картину мира, а лишь по мере собственного совершенствования постепенно приближается к уже известной по данным антропологии. Этот вывод получен не только картографическим, но и чисто статистическим методом. Например, для классических и ДНК маркёров, изученных строго в одних и тех же этносах Восточной Европы, получены одинаковые оценки различий между популяциями: GST=2.69 и GST=2.58, соответственно (см. главу 8). Таких примеров много. Вывод: когда исследование проведено корректно, результаты антропологии, старой «классической» генетики и современной молекулярной генетики совпадают: ДНК маркёры не дают иной картины мира. Расхождения возникают тогда, когда использованы неудачные выборки, популяции и маркёры. РАЗНЫЕ ТРАЕКТОРИИ МИКРОЭВОЛЮЦИИ ДНК МАРКЁРОВ Говоря о ДНК маркёрах, нельзя не упомянуть об их одном несомненном преимуществе перед классическими маркёрами - о значительном разнообразии типов ДНК маркёров. Когда мы достигаем такой изученности ДНК маркёров, что обобщённые карты, созданные по выборке разных типов ДНК маркёров, совпали с «общей моделью» (полученной по данным разных наук), то мы получаем надёжную точку отсчёта. Следующий шаг - сравнение «общей модели» и карт отдельных типов ДНК маркёров. Ведь разные типы маркёров могут различаться эволюционной траекторией, и тогда сравнение с «общей моделью» позволит выявить характер и причины этих отличий. Особое значение для антропологии имеют ДНК маркёры с «однородительским наследованием» (главы 6, 8, 9): по материнской линии - митохондриальная ДНК1; по отцовской линии - нерекомбинирующие участки Y хромосомы. Поскольку в популяциях разнообразие этих типов признаков очень велико и каждая популяция имеет своеобразный «генетический портрет», то они могут служить уникальными маркёрами миграционных потоков. Именно однородительские маркёры могут, наконец, разрешить проблему «промежуточных» антропологических типов: являются они метисными или же сохраняют недифференцированный прототип. Следует лишь помнить, что у однородительских маркёров есть серьёзные ограничения. Поскольку генетически эффективный размер популяции (Ne) по «однородительским» генам в 4 раза меньше, чем в среднем по геному, они подвержены значительно большему влиянию дрейфа генов и потому более «забывчивы»: дрейф генов может во многом стереть и существенно исказить генетическую память популяции. Именно поэтому на нынешнем витке науки вновь возникает поворот в сторону исследования аутосомных маркёров. Новые технологии - анализа панели сотен тысяч аутосомных ДНК маркёров со всех хромосом или же анализ гаплотипов (тесно сцепленных - рядом «сидящих» ДНК маркёров) - позволят сделать новый рывок в выявлении еще более устойчивой «общей модели» генофонда. ВРЕМЯ Анализ временных срезов генофонда... Изучение минувших генофондов... Задача, своей увлекательностью и масштабом завораживающая многих исследователей, не исключая и авторов этой книги. Что же может дать для решения этой задачи наш мультиокулярный подход, то есть знание того, что самые разные признаки при корректном анализе рисуют единую общую структуру генофонда? Большие надежды в решении этой задачи возлагаются обычно не столько на разработку методов синтеза данных археологии и генетики, сколько на чисто генетический анализ древней ДНК. Однако сбор достоверной популяционной информации потребует значительного времени. Да и тогда анализ палеоДНК будет нуждаться в контроле со стороны археологии. И как раз здесь возможности компьютерной картографии и мультиокулярного подхода велики. Построенные нами карты распространения материальной культуры Восточной Европы [Балановская и др., 2003] для двух этапов палеолита (26-16 тыс. лет и 15-12 тыс. лет) обнаружили высокое сходство и друг с другом, и с картами современного генофонда (см. раздел 9.1.), что подтверждает объективность выявленной ими картины. Однако и тут следует помнить о серьёзном ограничении: карты археологических культур и современности нельзя бездумно трактовать в терминах преемственности между древним и современным генофондами: передвижения населения столь велики, что генофонд прошедших времен можно проецировать в ту же точку географического пространства, что и современный генофонд, только в том случае, если есть доказательства прямой преемственности генофондов в столь длинной цепи поколений. КАРТОГРАФИЧЕСКАЯ ТЕХНОЛОГИЯ У мультиокулярного подхода есть мощный картографический арсенал для выявления «общей модели» генофонда. Обобщённые карты в зарубежной науке обычно представлены лишь «синтетическими» картами главных компонент. Поэтому и мы взяли этот метод за основу для сравнения «мнений очевидцев» о строении русского генофонда. Но этот инструмент лишь ведёт основную мелодическую нить. Его звучание мы дополнили множеством других инструментов, специально разработанных нами. Из них, пожалуй, самый перспективный - картографирование генетических расстояний. Он позволяет формулировать и проверять гипотезы о сходстве и различиях любых популяций. И авторы надеются, что он займёт достойное место в будущих исследованиях не только русского, но и иных генофондов. Его применение в этой книге показывает, что карты генетических расстояний, например, построенные по классическим и по ДНК маркёрам Европы, высоко коррелируют (раздел 8.3.). То есть новый инструмент - карты генетических расстояний - не менее успешно выявляет согласованность разных типов признаков, чем «синтетические» карты главных компонент. Однако спектр звучания нового инструмента намного шире - он позволяет отвечать на множество вопросов о степени сходства популяций, причём отвечать отчётливо и образно. Напомним и о таких незаменимых инструментах картографической технологии, как карты надёжности наших моделей или же корреляционные карты, наглядно показывающие, как связаны признаки в разных частях ареала. Не будем забывать и о столь важных обобщённых картах, как карты генетического разнообразия. Эти и другие инструменты описаны в Приложении - их слаженная игра позволяет объединить неизбежно односторонние мнения «очевидцев» в стройную симфонию генофонда. 1Когда я вижу слова «митохондриальная ДНК», я читаю «суперженская ДНК» и тогда понимаю, о чем идет речь. Именно такой термин «суперженская» использовали первооткрыватели. Затем любители запутывать мозги ввели в оборот термин «митохондриальная», который, к сожалению, стал наиболее употребительным. - Прим. изд. |
загрузка...