3.2. Как созданы картографические атласы
Универсальный адаптер - Карта- это матрица - И лишь потом картинка - Что такое обобщённые карты - Что такое Атласы - И как они устроены
БЕЗ КАРТ НЕТ СРАВНЕНИЙ Почему только картографический подход позволяет объединять и сравнивать данные по разным типам признаков? Признаки, изученные в разных популяциях, нельзя сравнить напрямую. Но можно сравнить интерполяционные карты распространения этих признаков. Так картографический подход становится единственным инструментом комплексного анализа. Например, классические и ДНК маркёры изучены в разных популяциях. И сравнить результаты этих работ напрямую невозможно, если пользоваться лишь статистическими методами. Картографирование позволяет создать карты, на которых значения обоих признаков показаны в одних и тех же точках. Тем самым снимается проблема неравномерной и различной изученности разных признаков. Оценка надёжности позволяет не заходить при этом слишком далеко, чтобы не сравнивать данные по тем областям карты, которые недостаточно обеспечены исходной информацией. ЧТО ТАКОЕ КАРТА Любые карты мы всегда видим в графическом виде, как образ, картинку. Но эти изображения являются лишь производными от «базовых» компьютерных карт - цифровых моделей карты (ЦМ). Исходным материалом для построения цифровой модели служат значения признака в изученных популяциях, эта информация берется из банков данных. К этим данным применяется интерполяционная процедура и создаётся цифровая модель. Она представляет собой трёхмерный массив чисел, моделирующий геногеографические характеристики каждой точки карты: географическую широту, географическую долготу и значение картографируемого признака. Именно эти истинные «базовые» карты, которые для человеческого глаза предстают лишь как матрицы чисел, дают возможность строить графические карты. Исходные популяции разбросаны в ареале неравномерно. Ареал как бы накрывается равномерной сетью, и для каждого узла сети рассчитываются интерполированные значения признака. Поскольку полностью идентичные сети набрасываются на распределение разных признаков, результаты оказываются полностью совместимыми. Каждый узел одной сети аналогичен соответствующему узлу другой сети. У них одинаковые координаты. И переходя от карты одного признака к карте другого, мы находим в аналогичном узле значение уже другого признака. Поэтому можно сравнить значения всех признаков в аналогичных узлах разных сетей. Мы можем количественно сравнивать любые интерполяционные карты друг с другом, если у этих карт одинаковые сети. Каждый узел сети - элемент общей матрицы. С матрицами можно проводить любые статистические операции. Матрица, сеть, цифровая модель интерполяционной карты - синонимы. На основе цифровых моделей (а не графических образов) ведется весь точный картографический анализ: анализируются закономерности «простых» карт и строится множество специальных обобщённых карт. Одну и ту же цифровую модель можно представить в разных графических вариантах, если использовать разные шкалы. При этом получаются различные картографические образы, отвечающие конкретным задачам исследования и особенностям зрительного восприятия. На рис. 10.3.1. (глава 10) в качестве примера показана одна и та же карта (одна и та же ЦМ), представленная в двух разных шкалах. В результате возникли два разных картографических образа. Поэтому при рассмотрении любых карт надо помнить, что непрерывный изменяющийся ряд значений ЦМ при создании графического образа превращен в небольшое число интервалов. И в зависимости от шкалы (границ интервалов) создаются разные графические образы. Это значит, что точное положение изолиний, каких-либо особенностей рельефа на карте не стоит абсолютизировать. Достаточно немного изменить шкалу, и изолиния пройдёт несколько иначе, и особенности очертаний изменятся. Поэтому мы говорим о выявлении резких границ только тогда, когда границы выявляются в самых разных шкалах, или выделяются по двум и более изолиниям. ТИПЫ ОБОБЩЁННЫХ КАРТ Важнейшим инструментом нашего исследования являются обобщённые карты. Мы создаём три типа обобщённых карт: карты главных компонент, карты генетических расстояний и карты разнообразия. Каждая из обобщённых карт показывает одну из главных тенденций в генофонде, концентрирует те закономерности, которые в картах отдельных признаков присутствовали только в очень «разбавленном виде». КАРТЫ ГЛАВНЫХ КОМПОНЕНТ (synthetic maps) - самые популярные обобщённые карты и в отечественных, и в зарубежных геногеографических работах. Анализ главных компонент - это известный статистический метод, который позволяет от множества исходных признаков перейти к нескольким новым, которые называются главными компонентами и являются максимально информативными. При этом первые несколько главных компонент высоко коррелируют с большинством исходных признаков. То есть нам не нужно рассматривать всё множество исходных признаков - достаточно рассмотреть две-три главные компоненты, и при этом мы не потеряем информацию - главные компоненты покажут нам то главное, что есть во всей совокупности исходных признаков. Две геногеографические школы, возглавляемые Ю. Г. Рычковым и L. L. Cavalli-Sforza, независимо пришли к мысли, что метод главных компонент идеален для выявления основных тенденций в генофондах. Эти два коллектива разработали оригинальные технологии картографирования главных компонент [Menozzi et al., 1978; Рычков, Балановская, 1992]. Точнее, методы расчёта карт главных компонент через карты отдельных признаков.1 Карты главных компонент - это карты новых, чрезвычайно информативных признаков. В отечественной традиции принято говорить, что они выявляют основные закономерности генофонда, за рубежом говорят более образно - о сценариях истории генофонда. Для признаков соматологии карты главных компонент заменяются их математическим аналогом - картами канонических переменных. Различие заключается лишь в методике расчёта (см. раздел 4.1.), а для интерпретации карт безразлично, какой показатель использован. КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ часто используются в отечественных исследованиях. Странно, что их не изобрели также за рубежом. Ведь в отличие от главных компонент, являющихся математической абстракцией, карты генетических расстояний проще для понимания. Генетические расстояния - интуитивно понятный и очень распространённый инструмент: они показывают величину различий между парой популяций. Чтобы получить карты генетических расстояний, нужно лишь нанести значения генетических расстояний на карту. В каждую точку карты нужно поместить величину расстояния от этой популяции (расположенной в данном месте карты) до одной и той же выбранной нами популяции. Эта популяция, от которой отсчитываются генетические расстояния до всех точек карты, в геногеографии называется «реперной популяцией». Реперную популяцию можно выбрать произвольно: англичане, угличане, смоляне, куряне, пенеги, печенеги, немцы, ненцы, талыши, латыши, или же, например, «средние показатели Восточной Европы». Карта расстояний покажет, население каких территорий генетически сходно с реперной популяцией, а где генофонд резко отличен от генофонда реперной популяции. Этот подход может применяться к любым признакам. Но если при анализе генов мы говорим о «генетических расстояниях», то при анализе антропологических данных используются другие формулы расчёта расстояния (степени различий двух популяций). Для геногеографии словосочетания «генетические расстояния», «многомерные расстояния», «обобщённые расстояния» - синонимы. Метод картографирования генетических расстояний описан в Приложении, а также главах 8 и 9. КАРТЫ РАЗНООБРАЗИЯ - третий тип обобщённых карт - ещё проще и очевиднее. Тем удивительнее, что, хотя показатели генетического разнообразия популяций рассчитываются всеми популяционными генетиками, эти значения наносились на карту обычно лишь в отечественных геногеографических работах. Карты разнообразия показывают уровень генетического разнообразия для каждой точки карты. Есть несколько показателей разнообразия, например - гетерозиготность. Или гаплотипическое разнообразие, карты которого могут быть двух видов: 1) карты общего гаплотипического разнообразия популяции (аналог гетерозиготности для гаплоидных однородительских ДНК маркёров) и 2) карты разнообразия гаплотипов в пределах одной гаплогруппы (показатель возраста гаплогруппы). Большинство карт разнообразия, рассматриваемых в этой книге, отражают внутрипопуляционное разнообразие. Однако иногда мы создаём и карты межпопуляционной изменчивости. Такие карты полезны как для выявления различий в степени межпопуляционной изменчивости в разных регионах, так и для поиска «генетических границ», то есть зон резких изменений в генофонде (близкий подход использован в работах [Barbujani, Sokal, 1990; Rosser et al., 2000]). Наконец, особым видом карт разнообразия являются карты случайного инбридинга (см. раздел 7.6.). «КОМБИНИРОВАННЫЕ» КАРТЫ. Кроме карт главных компонент, карт генетических расстояний и карт разнообразия в этой книге использованы и иные карты, представляющие алгебраическую комбинацию нескольких «простых» карт. Суммарные карты. Эти карты являются суммой отдельных карт, объединяемых по характеру их генетического ландшафта или иным свойствам. При построении таких карт суммируются значения, находящиеся в аналогичных узлах всех исходных карт (карт отдельных признаков). Мы приводим карты суммарной частоты западно-евразийских и восточно-евразийских гаплогрупп мтДНК (разделы 8.2. и 9.2). «Карты прародины» (см. раздел 9.2.) являются произведением двух карт: карты частоты гаплогруппы и карты разнообразия той же гаплогруппы. «Карты прародины» показывают, где одновременно высоки и частота, и разнообразие, то есть оконтуривают возможную область прародины гаплогруппы. Карты генетического риска (раздел 5.2.) рассчитываются по алгебраическим формулам из карт аллелей. Они показывают уровень генетической предрасположенности населения к тем или иным заболеваниям с учетом взаимодействия генов. В зависимости от задач исследования, можно создавать множество различных комбинированных карт - «алгебраичность» цифровых моделей и разработанное нами программное обеспечение GGMAG и MAPSTAT предоставляют для этого неограниченные возможности. ЧТО ТАКОЕ АТЛАС Рабочее название этой книги звучало так: «Атласы русского генофонда». Карты переполняют её, являются тем стержнем, который объединяет анализ всех типов признаков - антропологии, классической генетики, молекулярной генетики, фамилий. Но случайная подборка бесчисленных карт ещё не позволяет ни сравнить разные типы признаков, ни понять генофонд. Для этого нужны картографические атласы. Необходимым инструментом геногеографии служат «простые» карты - карты распределения признака по ареалу популяции. Однако каждая отдельно взятая «простая» геногеографическая карта заранее неизвестным образом соединяет в себе как бы две карты. Одна составляющая («общий ландшафт») отражает универсальные свойства пространственной структуры генофонда, его каркас, его архитектонику. Общий ландшафт одинаков во всех «простых» картах, он как бы является подстилающей основой. Вторая составляющая («особенное») простой карты вбирает все особенности в географии данного признака - особенности взаимодействия отдельного гена с окружающей средой, особенности истории дрейфа генов и отражения миграций. Чтобы отделить общее от особенного, надо от создания «простых» карт перейти к созданию геногеографического атласа изучаемого генофонда. Картографический атлас представляет собой «систематическое собрание географических карт, выполненное по общей программе как целостное произведение» [Салищев, 1982]. Чтобы стать геногеографическим атласом, собрание геногеографических карт должно удовлетворять следующим требованиям, сформулированным еще 15 лет назад [Балановская и др., 1990]: 1) Должны быть соблюдены единые критерии организации исходных популяционно-генетических данных в отношении автохтонности населения, популяционных ареалов и других параметров. Это означает, что ко всем популяциям надо предъявить одни и те же требования (например, коренное сельское население, в пределах «исконного» ареала, объём выборки не ниже такого-то, данные только по маркёрам определённого типа). И включить в анализ только те популяции из имеющихся в банке данных, которые удовлетворяют этому единому набору критериев. Если часть данных не удовлетворяет этим критериям (например, не коренное население) - такие данные нельзя включать в тот же атлас, но можно создать отдельный «атлас современного населения». 2) Должны быть выдержаны единые принципы построения карт, единая техника их расчёта и приёмов изображения, унификация географического и генетического масштабов, легенды карты и т. д. Все карты должны быть построены одной программой, с одними и теми же параметрами картографирования. Все карты атласа должны относиться к одному региону. При наложении таких карт друг на друга все моря и реки совпадают. Шкалы должны подбираться по общим принципам, например, только равномерные шкалы, постоянное число интервалов для всех карт данного типа. 3) Выполнение этих требований должно обеспечивать единство правил прочтения и анализа всех геногеографических карт, высокий и единый уровень воспроизводимости всех карт атласа. Все карты одного типа читаются одинаково - например, тёмно- окрашенные (на цветных картах коричневые) области на любой карте означают максимальные значения признака. Но карты разного типа читаются по-разному. Например, на картах генетических расстояний минимальные значения означают сходство с реперной популяцией (и близки к нулю), а на картах главных компонент — область одного из двух экстремумов (отрицательные значения). 4) Геногеографический атлас должен завершаться картографическим обобщением частных карт, дающим интегральные характеристики географической структуры генофонда популяции. Действительно, именно раздел обобщённых карт несет важнейшую информацию о генофонде. Это обычно небольшое количество обобщающих карт. КАК УСТРОЕНЫ АТЛАСЫ В нашем исследовании по каждому типу признаков создан отдельный картографический Атлас: по одному атласу на данные каждой науки. Все Атласы являются геногеографическими. Именно это их объединяет - методы построения, цели их создания, способ интерпретации. А сами данные различны: антропологические признаки, классические генетические маркёры, ДНК маркёры, фамилии. Полностью совместимые электронные картографические Атласы русского генофонда по данным соматологии, дерматоглифики, антропонимики, классической и молекулярной генетики созданы впервые - и впервые эта книга дает возможность напрямую сопоставить результаты, полученные всеми этими науками. Масштаб Атласов русского генофонда задан историческим ареалом русского народа - все карты построены в пределах «исконного» русского ареала. Однако для ряда признаков мы создали и картографические Атласы в масштабе двух других регионов: Восточной Европы и Евразии. Карты Восточной Европы особенно важны для понимания взаимодействия русского генофонда с соседями. Эти карты показывают изменчивость во всех популяциях Восточной Европы, включающих наряду с русским генофондом и популяции всех других генетически изученных народов этого региона. Карты Евразийского генофонда позволяют рассмотреть русский генофонд в общемировом масштабе изменчивости, позволяют определить его место в системе генофондов человечества. В разделе 5 Приложения мы приводим основную «техническую» информацию о картографических атласах, на которых построена книга. Эта информация справочного характера - к ней можно обращаться по необходимости, читая интересующую главу. Однако она может служить и путеводителем, позволяя решить - стоит ли заглядывать в ту или иную главу? Поэтому для каждого атласа мы указали, в каких главах рассматриваются его карты. 1Рассчитать главные компоненты, не картографируя отдельные признаки, было невозможно - потому что разные классические маркёры, с которыми тогда работали, были изучены в разных популяциях. |
загрузка...