Борислав Козловский /

Как гены Чингисхана похоронили врачебную тайну

Социальные сети любителей родословных — ключ ко взлому персональных данных с помощью ДНК

Иллюстрация: AFP/East News
Иллюстрация: AFP/East News
+T -
Поделиться:

ДНК на наших глазах превращается из «отпечатков пальцев» (которые еще поди найди в картотеке) в паспорт, брошенный на месте преступления. Команда генетиков из MIT, Гарварда, Беркли и Тель-Авивского университета продемонстрировала: имея анонимный образец ДНК (из волоса, капли крови, откуда угодно), легко можно вычислить фамилию и даже имя человека, которому ДНК принадлежит.

Для белого американца-мужчины, выбранного наугад из 315-миллионного населения США, новый метод срабатывает в 12 случаях из 100. А для представителя верхнего среднего класса шансы быть узнанным, похоже, еще выше.

Глобальная дыра в защите личной информации открылась благодаря социальным сетям любителей генеалогии (таким, как familytreedna.com или dna.ancestry.com). По-настоящему популярным это научное хобби сделала история про ДНК Чингисхана: генетики выяснили, что каждый двухсотый мужчина на планете — его прямой потомок. Кому не хочется обнаружить в себе гены древнего завоевателя?

Чтобы найти живых незнакомых родственников или предков царской крови, энтузиасты выкладывают в открытый доступ результаты анализа своего генома. Оказывается, тем самым они деанонимизуют не только себя, но и многие тысячи своих дальних родственников.

«Узнайте, кто вы: скандинав? западный африканец? индеец? А хотите познакомиться со своим троюродным братом?» — так сайт dna.ancestry.com уговаривает взяться за анализ родословной. За 149 долларов компания берется расшифровать Y-хромосому, одну из 46 порций ДНК в каждой клетке мужского организма. (У женщин ее нет, но можно попросить отца или брата отослать на анализ свой биоматериал). От других хромосом она выгодно отличается тем, что передается по мужской линии почти неизменной.

«Почти» — потому что изредка в дело вмешиваются мутации. Они и позволяют установить степень родства. Скажем, три-четыре буквы генетического кода повторяются десять раз подряд, как если бы у сложной внутриклеточной машины, копирующей ДНК, внезапно заело пластинку. Это называют Y-STR (от термина short tandem repeat — «короткий тандемный повтор»).

Так вот, одинаковые Y-STR у двух человек — верный признак, что они унаследовали свою мутацию от одного и того же предка. Чем больше таких совпадающих мутаций, тем сильнее родственные связи. Например, троюродный брат получил свою Y-хромосому от общего с вами прадеда, и все отличия в ДНК, которые у вас есть, накопились всего за четыре поколения.

Но фамилия тоже наследуется по мужской линии. То есть носители похожих Y-хромосом с большой вероятностью будут однофамильцами, пусть даже супружеские измены и усыновления слегка искажают картину. Поэтому для начала ученые попробовали установить фамилии 911 добровольных доноров ДНК, согласившихся проверить свои персональные данные на «взломоустойчивость».

34 хромосомных маркера (несколько упрощая, это список мутаций) каждого из подопытных вбивали в строку поиска общедоступных сайтов smgf.org и ysearch.org, которые дают бесплатный доступ к базам данных FamilyTreeDNA и Ancestry.com. В дни эксперимента оба ресурса содержали 135 тысяч генетических «досье», соответствующих 39 тысячам разных фамилий. Теперь на одном только FamilyTreeDNA.com уже 248 тысяч записей — любительская генеалогия стремительно входит в моду.

Только для 17 человек из 911 не нашлось ничего вообще. У прочих обнаружились хотя бы дальние, но родственники. 110 человек имели хотя бы с кем-нибудь из базы данных одного прапрапрадеда (пять поколений до общего предка). Для этой счастливой сотни шансы угадать фамилию оказались рекордно высоки — семь из десяти. Но даже десять-двадцать поколений до общего предка не сводят их к нулю. Наконец, нашлись и такие, у которых в семье фамилия не менялась целых 35 поколений подряд (больше 500 лет) — ну, или почти не менялась: например, у двух ветвей семейства Сэйров родом из графства Бедфордшир в Англии слегка разнится ее написание.

Фамилию выяснить легко, а как быть с именем? Тут в ход пошли возраст добровольца и штат, где он живет (эти данные традиционно указывают в сопроводительных бумагах к любому медицинскому образцу. Даже если тот анонимный, как ДНК в эксперименте).

Простой поиск по возрасту и штату в половине случаев выдает как минимум 60 тысяч кандидатов (допустим, где-нибудь в Айове живет 60 тысяч 34-летних). Но знание фамилии сужает список примерно до 12 человек. Перебрать дюжину вариантов, если вы всерьез настроены найти человека по ДНК, не так уж и сложно: к вашим услугам социальные сети с его фотографиями, родом занятий, конкретным местом жительства и так далее.

Общая доля успешных угадываний фамилии — 12 процентов. Задним числом ученые признали, что, не гонись они за академической строгостью, могли бы улучшить результат до 18 (то есть опознать каждого пятого). Само собой, в разных социальных группах этот процент разный. Особенно уязвимы личные данные тех, кто больше всего о них заботится. А именно — верхнего слоя среднего класса, который интересуется своим происхождением особенно активно. И поэтому чаще прочих оставляет след в генеалогических базах данных. Пока аудитория этих баз растет, «взломоустойчивость» ДНК будет падать и падать.

Какой от этого всего ожидается практический вред? Самые хрестоматийные жертвы — доноры спермы. Их желание остаться анонимными понятно — кого обрадует внезапный оклик из-за угла: «Вот ты где, биологический папа!» Такое случалось и раньше, однако то, что в 2005 году было редким казусом, теперь станет рутинной практикой.

Как расширятся репрессивные возможности государства, тоже ясно. Прикоснулись пальцем к партизанской листовке против людоедского закона, оставили пятно своей крови на полицейской дубинке на несанкционированном митинге — и нет больше нужды искать вас по фотороботу.

Но неприятности грозят даже тем, кто не увлекается ни протестами, ни анонимным донорством. ДНК несет массу сведений о риске врожденных болезней, которыми интересуются, например, страховые компании. Любой волос, подобранный на улице, эту информацию содержит. Но если раньше, когда установить его владельца не было возможности, пользы от массива диагнозов безымянному пациенту тоже не было.

Теперь для злоумышленников открывается масса возможностей ею воспользоваться. Ее можно продать спамерам, которые будут целенаправленно забивать почтовые ящики не просто рекламой виагры, а предложениями целебных порошков от рака или Альцгеймера, если у вас предрасположенность именно к этим болезням. Или страховщикам, которые без объяснений завысят цену своих услуг.

Выходов два: жить, не оставляя следов, либо ждать законов, которые приравняют инструменты для анализа ДНК к автомату Калашникова и поставят их под жесткий контроль. Но тогда про персональную геномику и ДНК-генеалогию придется забыть.

Комментировать Всего 6 комментариев

Живя в стране, где число секвенаторов последнего поколения не превышает дюжины (да и те сосредоточены в трех городах и нередко стоят без расходных материалов), можно позволить себе ближайшие 20 лет об этом не беспокоиться. 

По крайней мере базе российских фамилий это не мешает расти бешеными темпами. Если заглянуть, допустим, на русскоязычный форум molgen.org, там обнаружатся многие тысячи юзеров, обеспокоенных своей гаплогруппой - чтобы, не дай Сварог, это была не J1, а, наоборот, что-нибудь поближе к Рюриковичам. Из-за интереса к евразийству и панславянизму градус страстей даже больше, чем в США. Будь я конспиролог, я бы предположил, что русские генеалогические сервисы чекисты должны были ввести в оборот даже раньше "Одноклассников", подкрепив это дело Дугиным - в целях скорейшей переписи населения

С их точки зрения, думаю, тут минусы перевешивают плюсы. Плюс в том, что можно какое-то количество денег под это попилить. А минус – любая реальная криминалистическая методика мешает фабриковать дела на пустом месте.

Возьмем, скажем, видеорегистраторы и камеры наблюдения. В большинстве стран либеральная общественность клеймит их как наступление на гражданские свободы. В России же, напротив, камеры и регистраторы вызывают нарекания в основном у правоохранительных структур (да и данные с них, как правило, исчезают, как только в них появляется процессуальная нужда).

Пока я встречал только одно массовое употребление этих сведений: для доказательства, что "Татаро-монгольского ига никогда не существовало", так как "монгольского генного материала" у россиян-де "слишком мало"...

При чём, уровень дискуссантов был такой, что они совершенно не могли объяснить, почему имеющегося у россиян "монгольского генного материала" "слишком мало", и сколько его должно бы быть, чтобы сомнений в реальности "татаро-монгольского ига" у них не возникало...

Из чего для меня напрашивается вывод - что вряд ли нас ожидают серьёзные проблемы с этого направления в ближайшем будущем...

кажется, ноги растут от работы академика Захарова-Гезехуса (между прочим, директора Института генетики РАН, так что я бы поспорил об "уровне дискуссантов" - или, по крайней мере, об их статусе в российской научной иерархии). Вместе с коллегами из Магадана - а там на редкость приличная генетическая лаборатория при  Институте биологических проблем Севера - он искал "гаплогруппу Чингисхана" в России и обнаружил ее частоту около 0.7 процента. Это на фоне 50 процентов у алтайских казахов и 56 процентов у монголов.

Сам Захаров-Гезехус нигде татаро-монгольского ига не отрицает. Другой вопрос, что на него ссылается в статье с таким посылом сайт "Новой хронологии", то есть адепты Фоменко, и еще академик не гнушается рецензировать, скажем, книгу "Русский генофонд на русской равнине", где отрицатели ига резвятся вовсю.

Понятно, что я спорил не с академиком. А вот фоменковцы, действительно, его данными пользуются... И именно они и не знают, сколько должно быть, чтобы генетические данные подтверждали Иго, но, разумеется, уверены, что имеющиеся данные Иго опровергают...