Как гены Чингисхана похоронили врачебную тайну
ДНК на наших глазах превращается из «отпечатков пальцев» (которые еще поди найди в картотеке) в паспорт, брошенный на месте преступления. Команда генетиков из MIT, Гарварда, Беркли и Тель-Авивского университета продемонстрировала: имея анонимный образец ДНК (из волоса, капли крови, откуда угодно), легко можно вычислить фамилию и даже имя человека, которому ДНК принадлежит.
Для белого американца-мужчины, выбранного наугад из 315-миллионного населения США, новый метод срабатывает в 12 случаях из 100. А для представителя верхнего среднего класса шансы быть узнанным, похоже, еще выше.
Глобальная дыра в защите личной информации открылась благодаря социальным сетям любителей генеалогии (таким, как familytreedna.com или dna.ancestry.com). По-настоящему популярным это научное хобби сделала история про ДНК Чингисхана: генетики выяснили, что каждый двухсотый мужчина на планете — его прямой потомок. Кому не хочется обнаружить в себе гены древнего завоевателя?
Чтобы найти живых незнакомых родственников или предков царской крови, энтузиасты выкладывают в открытый доступ результаты анализа своего генома. Оказывается, тем самым они деанонимизуют не только себя, но и многие тысячи своих дальних родственников.
«Узнайте, кто вы: скандинав? западный африканец? индеец? А хотите познакомиться со своим троюродным братом?» — так сайт dna.ancestry.com уговаривает взяться за анализ родословной. За 149 долларов компания берется расшифровать Y-хромосому, одну из 46 порций ДНК в каждой клетке мужского организма. (У женщин ее нет, но можно попросить отца или брата отослать на анализ свой биоматериал). От других хромосом она выгодно отличается тем, что передается по мужской линии почти неизменной.
«Почти» — потому что изредка в дело вмешиваются мутации. Они и позволяют установить степень родства. Скажем, три-четыре буквы генетического кода повторяются десять раз подряд, как если бы у сложной внутриклеточной машины, копирующей ДНК, внезапно заело пластинку. Это называют Y-STR (от термина short tandem repeat — «короткий тандемный повтор»).
Так вот, одинаковые Y-STR у двух человек — верный признак, что они унаследовали свою мутацию от одного и того же предка. Чем больше таких совпадающих мутаций, тем сильнее родственные связи. Например, троюродный брат получил свою Y-хромосому от общего с вами прадеда, и все отличия в ДНК, которые у вас есть, накопились всего за четыре поколения.
Но фамилия тоже наследуется по мужской линии. То есть носители похожих Y-хромосом с большой вероятностью будут однофамильцами, пусть даже супружеские измены и усыновления слегка искажают картину. Поэтому для начала ученые попробовали установить фамилии 911 добровольных доноров ДНК, согласившихся проверить свои персональные данные на «взломоустойчивость».
34 хромосомных маркера (несколько упрощая, это список мутаций) каждого из подопытных вбивали в строку поиска общедоступных сайтов smgf.org и ysearch.org, которые дают бесплатный доступ к базам данных FamilyTreeDNA и Ancestry.com. В дни эксперимента оба ресурса содержали 135 тысяч генетических «досье», соответствующих 39 тысячам разных фамилий. Теперь на одном только FamilyTreeDNA.com уже 248 тысяч записей — любительская генеалогия стремительно входит в моду.
Только для 17 человек из 911 не нашлось ничего вообще. У прочих обнаружились хотя бы дальние, но родственники. 110 человек имели хотя бы с кем-нибудь из базы данных одного прапрапрадеда (пять поколений до общего предка). Для этой счастливой сотни шансы угадать фамилию оказались рекордно высоки — семь из десяти. Но даже десять-двадцать поколений до общего предка не сводят их к нулю. Наконец, нашлись и такие, у которых в семье фамилия не менялась целых 35 поколений подряд (больше 500 лет) — ну, или почти не менялась: например, у двух ветвей семейства Сэйров родом из графства Бедфордшир в Англии слегка разнится ее написание.
Фамилию выяснить легко, а как быть с именем? Тут в ход пошли возраст добровольца и штат, где он живет (эти данные традиционно указывают в сопроводительных бумагах к любому медицинскому образцу. Даже если тот анонимный, как ДНК в эксперименте).
Простой поиск по возрасту и штату в половине случаев выдает как минимум 60 тысяч кандидатов (допустим, где-нибудь в Айове живет 60 тысяч 34-летних). Но знание фамилии сужает список примерно до 12 человек. Перебрать дюжину вариантов, если вы всерьез настроены найти человека по ДНК, не так уж и сложно: к вашим услугам социальные сети с его фотографиями, родом занятий, конкретным местом жительства и так далее.
Общая доля успешных угадываний фамилии — 12 процентов. Задним числом ученые признали, что, не гонись они за академической строгостью, могли бы улучшить результат до 18 (то есть опознать каждого пятого). Само собой, в разных социальных группах этот процент разный. Особенно уязвимы личные данные тех, кто больше всего о них заботится. А именно — верхнего слоя среднего класса, который интересуется своим происхождением особенно активно. И поэтому чаще прочих оставляет след в генеалогических базах данных. Пока аудитория этих баз растет, «взломоустойчивость» ДНК будет падать и падать.
Какой от этого всего ожидается практический вред? Самые хрестоматийные жертвы — доноры спермы. Их желание остаться анонимными понятно — кого обрадует внезапный оклик из-за угла: «Вот ты где, биологический папа!» Такое случалось и раньше, однако то, что в 2005 году было редким казусом, теперь станет рутинной практикой.
Как расширятся репрессивные возможности государства, тоже ясно. Прикоснулись пальцем к партизанской листовке против людоедского закона, оставили пятно своей крови на полицейской дубинке на несанкционированном митинге — и нет больше нужды искать вас по фотороботу.
Но неприятности грозят даже тем, кто не увлекается ни протестами, ни анонимным донорством. ДНК несет массу сведений о риске врожденных болезней, которыми интересуются, например, страховые компании. Любой волос, подобранный на улице, эту информацию содержит. Но если раньше, когда установить его владельца не было возможности, пользы от массива диагнозов безымянному пациенту тоже не было.
Теперь для злоумышленников открывается масса возможностей ею воспользоваться. Ее можно продать спамерам, которые будут целенаправленно забивать почтовые ящики не просто рекламой виагры, а предложениями целебных порошков от рака или Альцгеймера, если у вас предрасположенность именно к этим болезням. Или страховщикам, которые без объяснений завысят цену своих услуг.
Выходов два: жить, не оставляя следов, либо ждать законов, которые приравняют инструменты для анализа ДНК к автомату Калашникова и поставят их под жесткий контроль. Но тогда про персональную геномику и ДНК-генеалогию придется забыть.