Ген, которого не было: как сделать себе защиту от вируса буквально из ничего
В научной популяристике существуют свои забавные традиции и шаблоны. Например, если автор хочет удивить читателя чем-то молекулярно-биологическим, он должен сперва хотя бы один абзац посвятить тому, что белки закодированы в ДНК в виде текста из четырех букв АГЦТ, который сперва переписывается в виде РНК, а затем поступает на рибосому для синтеза цепочки аминокислот, каждой из которых соответствует ровно три буквы. Якобы читатель, который этого не знал, может с помощью этого абзаца быстренько нагнать остальное человечество, а дальше уже удивляться наравне с остальными.
Конечно, в этом снисхождении к невеждам нет никакого смысла: если вы вот только сейчас узнали про генетический код и догму ДНК —> РНК —> белок, вам на сегодня уже есть чему удивляться, какую бы сногсшибательную научную новость ни намеревался вслед за этим поведать бедолага-автор. С тех пор как в 1960-х гг. ученые это открыли, ничего столь же сенсационного молекулярная биология не породила.
Тем не менее иногда про «центральную догму» вспоминают и по вполне весомым поводам — чаще всего в те моменты, когда вдруг оказывается, что жизнь может работать и по-другому. Так было в 1970-м, когда была открыта «ревертаза», она же обратная транскриптаза — фермент, умеющий переписывать генетический текст из РНК обратно в ДНК. Тогда к «догме» добавили еще одну стрелочку, и получилось ДНК <—> РНК —> белок.
А как бы вам понравилось такое: ДНК —> РНК —> другая непохожая ДНК —> другая непохожая РНК —> белок, не имеющий начала и конца? Примерно об этом идет речь в недавней статье Сэмюэла Стернберга и его коллег из Колумбийского университета в Нью-Йорке. Сперва в мае вышел препринт, изрядно переполошивший молекулярно-биологическую общественность, а на этой неделе появилась и парадная статья в Science. В одном из отзывов на статью встречается выражение «инопланетная биология», а такими словами ученые не бросаются.
Если забыть про догмы и стрелочки, эта статья о том, что бактерии могут спастись от вирусов-бактериофагов, изготовив себе практически на пустом месте новый ген. В этом гене содержится информация, которой не было, нет и не будет в самом бактериальном геноме. А потому что никто не говорил, что жизнь должна быть устроена изящно, экономно и единообразно: она, жизнь, существует не затем, чтобы поражать своей гармонией молекулярных биологов. Вот теперь наконец можно рассказать все по порядку.
Инопланетная биология
Все живое постоянно борется с вирусами. Биологи открыли десятки, если не сотни, разных систем, с помощью которых живые существа, от бактерий до людей, научились противостоять инфекциям. У бактерий открывать такие системы, наверное, проще всего: находим мутантов, обладающих повышенной чувствительностью к вирусу (у бактерий их называют «бактериофагами»), и смотрим, что же у них сломано. Обычно бывает сломан какой-то ген, кодирующий белок — например, белок, умеющий портить вирусную ДНК или РНК. Такова самая знаменитая сегодня система CRISPR-cas9, которую используют для редактирования человеческих генов: в этом бактериальном механизме cas9 — это как раз белок, который портит вирусную ДНК. Такой же принцип у «систем модификации-рестрикции», у которых ученые позаимствовали главный инструмент генной инженерии — молекулярные ножницы-рестриктазы.
В этом арсенале особняком стояла система под названием DRT2, потому что никто не мог понять, как она работает. Ее название означает «защитная обратная транскриптаза», то есть ген, обеспечивающий этот механизм устойчивости, кодирует белок «обратную транскриптазу», способный синтезировать ДНК на матрице РНК. В таких генах самих по себе нет большой экзотики, их в геномах много, потому что они часто входят в арсенал вирусов и вместе с ними накапливаются в хромосомах. Однако странность в том, что эта система защиты включала обратную транскриптазу… и больше как бы ничего. Ну хорошо, там в начале еще приделан некий хвост, из которого может получиться небольшая молекула РНК, но она уж точно ничего не кодирует: нету в ней, как говорят биологи, «открытых рамок считывания», то есть длинных участков, не прерываемых стоп-сигналами. Обратная транскриптаза может, конечно, синтезировать какую-то ДНК (знать бы еще, какую именно), но как это повредит вирусу?! К тому же эта странная защитная система не имела выключателя на случай вирусной атаки: ген работал, как говорят биологи, «конститутивно», то есть с него тихонько считывалась РНК, а с нее белок, независимо от того, что там происходит в клетке.
К этой загадке и подступились молекулярные биологи из Колумбийского университета. И разгадали ее. Ужасно хочется нагнать детективного саспенса и оставить разгадку на закуску, но тема у нас и так не слишком простая и популярная, так что сразу расскажем, что именно они — с огромным изумлением — обнаружили.
Ключевой элемент конструкции — как раз та самая небольшая РНК, которая считывается с нашего гена. Она ничего не кодирует, зато может складываться в хитрую загогулину, так что часть ее образует что-то вроде кольца. Именно там и открывается поле деятельности для обратной транскриптазы: она начинает строить на базе этого кольца ДНК. А построив, заходит на новый круг, то есть так и бегает по кольцу, выдавая длинную-предлинную одиночную цепь ДНК. Причем при перескакивании на новый круг она еще и добавляет буквы-нуклеотиды, которых в изначальном тексте не было. В этих добавленных буквах вся сила: во-первых, именно благодаря им образуется «открытая рамка», то есть повторяющееся звено содержит ровно 40 кодонов, каждый из которых кодирует какую-то аминокислоту (то есть все это вместе кодирует бесконечную цепочку аминокислот без стоп-сигналов). Во-вторых, теперь каждое звено содержит сигнал начала трансляции, точку связывания рибосомы и даже последовательность промотора, то есть знак для клетки, что эту ДНК нужно считывать, ибо в ней заключен большой смысл. Этот знак образуется ровно в том месте, где заканчивается один круг и начинается второй, так что в изначальном тексте его просто не было.
Все это происходит в клетке еще до того, как на нее набросится вирус. А вот когда он набрасывается, одиночная цепь ДНК достраивается до двойной, и промотор (как мы помним, возникший словно бы ниоткуда сам собой) включается на полную силу. То есть с любого из звеньев этой новой ДНК — болтающейся, очевидно, сама по себе вне всякого генома — начинает считываться бесконечная РНК, а с нее и белок, опять же бесконечный. Его авторы назвали neo, и это расшифровывается как no-end ORF, то есть «открытая рамка без конца». Хотя, конечно, они наверняка вспоминали и Киану Ривза из «Матрицы».
Этот бесконечный белок и есть главное оружие противовирусной защиты: он останавливает все процессы в клетке, так что вирус просто не может размножиться (и заразить соседние клетки). В этих физиологических тонкостях пока никто не разбирался: хотя они тоже страшно интересные, однако меркнут по сравнению с изготовлением бесконечного гена из подсобных материалов.
Лекарство от зазнайства
Способность удивляться очень зависит от накопленного багажа знаний (круглые черви, к примеру, удивляться вообще не способны). Поэтому какой-то категории читателей, наверное, придется объяснить, что же в этом открытии такого сногсшибательного. Да, возникает ген, который не является частью хромосомы, а болтается где-то отдельно. Не сенсация: таких генов у бактерий хоть пруд пруди. Да, ген кодирует белок произвольной длины, практически бесконечный — странно, конечно, но тоже еще терпимо. А удивительно то, что ген делается «под заказ» прямо на глазах изумленной публики, причем из того, что на этот ген совсем не похоже.
Неспроста ведь «центральную догму» так назвали: именно на ней держится современная биология. Все белки закодированы в геномах в виде трехбуквенного кода. Расшифровываем геномы (это сейчас происходит практически еженедельно), потом заставляем компьютер искать в этих геномах «открытые рамки», то есть участки, способные кодировать осмысленный, достаточно длинный белок. Опыт показывает, что подавляющее большинство «рамок» существуют там не просто так, а действительно кодируют белки. Генетический код позволяет предсказать последовательность аминокислот, а всякие сложные компьютерные программы на основе этой последовательности предсказывают, как именно эта цепочка аминокислот сложится, на что она будет похожа и на что она, скорее всего, будет способна в живой клетке. На входе череда букв АГЦТ, на выходе вся сложность жизни. Прямая дорога познания, даже скучно.
Ну да, некоторые уже было решили, что основная интрига в молекулярной биологии разворачивалась в прошлом веке, а теперь стало скучно. Но ведь нет же: Сэмюэлу Стернбергу и его соавторам скучно уж точно не было. Никакие компьютеры и геномные базы данных не решили бы их проблему, потому что стандартные процедуры исследования тут бессильны. Вот бактерия, вот механизм ее перехода в спящее состояние с помощью определенного белка — длинной-длинной вереницы повторяющихся альфа-спиралей. Этот белок — центральный элемент картины. Где он закодирован? А нигде! Он вырастает на пустом месте, потому что какая-то ревертаза на первый взгляд неаккуратно — хотя на самом деле это результат очень продуманной небрежности — лепит одну за другой копии некой кольцевой матрицы, которую ни одна компьютерная программа ни в одном геноме и не нашла бы.
Наш человеческий геном, кстати, расшифрован. А есть ли у нас такой белок? А неизвестно, может и есть. Никакой стандартный алгоритм его не находит, но эти алгоритмы не нашли бы и бактериальные neo — а подобные системы тем не менее есть у самых разных бактерий. Много что можно наделать из коротких некодирующих РНК с помощью не слишком аккуратных обратных транскриптаз. И чтобы раскопать результаты этой деятельности, нашей обычной «биоинформатики» категорически недостаточно. Если кто-то решил, что все инструменты познания у человечества в кармане и наступило скучное время, он сильно заблуждался. Зазнаваться пока очень рано.
Ну вот, теперь я сделал все, от меня зависящее, чтобы хоть кого-нибудь удивить. Те, кто из этой статьи узнал о том, что белки закодированы в генах, могут начать удивляться уже с того места. Те же, кому удивительным показалось именно устройство противовирусной системы DRT2, в котором разобрались нью-йоркские биологи, могут обратиться к оригинальной научной статье, а поскольку доступ к ней платный, разумно ничего не платить, а прочитать первоначальный препринт, лежащий в открытом доступе. Написано легко, не оторвешься.