26 ноября 2020 г., 12:20

Как часто ошибаются тесты на коронавирус. Отрывок из новой книги молекулярного биолога Ирины Якутенко

Иллюстрация: Олег Добровольский

Чувствительность и специфичность — два главных параметра, которые определяют ценность теста в качестве диагностического инструмента. Говоря простым языком, именно от них зависит, насколько можно доверять его результатам. Не путаться в терминах отлично помогает мем про беременность, который воспроизведен на рисунке 11.

Когда тест не находит заболевание у тех, кто болеет, — это низкая чувствительность. Когда находит у того, кто здоров, — низкая специфичность. Эти два параметра обратно связаны друг с другом: как мы уже обсудили выше, увеличивая одно, мы неизбежно занижаем другое. Обычно тесты, используемые для диагностики заболеваний, выкручивают на максимум чувствительности. Потому что мы хотим обнаружить всех носителей, а в случае генетического теста на COVID-19 еще и изолировать их, чтобы прервать как можно больше возможных цепочек заражения.

В тестах на антитела к SARS- CoV-2 разумнее увеличивать специфичность: если тест будет выдавать положительный результат всем, кто недавно болел простудой коронавирусного происхождения, мы будем думать, что в обществе существенно больше перенесших COVID-19, чем на самом деле. Исходя из этих цифр, политики могут решить, что тот самый коллективный иммунитет уже близок, ослабить меры предосторожности и не держать резервных коек в больницах — ведь почти все уже переболели. Отвлекаясь даже от факта, что мы не знаем, гарантирует ли наличие антител к белкам SARS- CoV-2 длительную защиту от повторного заражения, резкое ослабление мер в популяции, где большинство вовсе не встречалось с вирусом, неизбежно даст всплеск заболеваемости.

Чувствительность большинства используемых сейчас тестов на антитела колеблется около цифры 99%. Разброс по специфичности больше — он составляет в среднем от 90 до почти 100%. Кажется, что это неплохие показатели, но в действительности все не так радужно. Да, сами по себе эти значения вполне приличные, но для массового скрининга (тотальной проверки), особенно в популяции, где не очень много людей переболело COVID-19, они не так уж хороши. Чтобы понять, как общее число переболевших влияет на пригодность теста, хотя сам он при этом не меняется, рассмотрим конкретный пример.

Представим, что в некоей популяции — пускай это будет Москва — COVID-19 переболели 5% жителей (для простоты будем считать, что у всех у них теперь есть антитела). Пускай у нас есть тест на антитела с чувствительностью 99% и специфичностью 98%. Мы наугад выбрали 1000 человек и собираемся проверить их нашим тестом. Если выборка совершенно случайная, 5% — то есть 50 человек — имеют антитела к SARS- CoV-2. Так как чувствительность теста не 100%, а только 99, 1% из реально переболевших получат ложноотрицательный результат. 1% от 50 человек — это 0,5 человека. Казалось бы, никакой разницы. Но продолжим наши рассуждения. Специфичность теста 98%, то есть 2% из тех, кто не болел COVID-19, получат ложный результат, будто они болели. В нашей тысяче москвичей не болели 95%, то есть 950 человек. 2% от 950 — это 19 человек, которым сообщат, что у них есть антитела к коронавирусу, хотя на самом деле их нет. Теперь важный момент: в реальности сотрудники лаборатории не знают, у кого из тех, кто признан переболевшим, реально есть антитела, — это знаем только мы как авторы этой задачки. Но клиницисты могут подсчитать, какова вероятность, что любой из полученных положительных результатов — ложный. Для этого нужно разделить число тех, кто получил положительный результат ошибочно, на общее число положительных результатов. В нашем случае это 19 человек, а всего узнали, что они перенесли коронавирусную инфекцию, 19+49,5 = 68,5 человека. 19/68,5 = 0,27, то есть 27%. Другими словами, больше четверти положительных результатов в реальности являются ложноположительными.

Иллюстрация: United Nations COVID-19 Response/Unsplash

Теперь представим, что в Москве переболело 50% населения. Тогда, повторив наши рассуждения, мы получим, что лишь чуть меньше 2% положительных результатов тестов на COVID-19 окажутся неверными. С ростом доли переболевших знаменатель дроби в формуле, по которой мы рассчитываем вероятность ошибки, становится все больше, а значит, результат деления — все меньше. Другими словами, значимость положительного и отрицательного результатов теста (а следовательно, пригодность этого теста для массовых скринингов) зависит от того, насколько широко распространено изучаемое заболевание. Для вас лично из этой абстрактной математической закономерности вытекают два практических следствия. Чем меньше людей реально переболели COVID-19, тем выше вероятность, что ваш положительный результат неверен (ни у кого еще нет антител, а у меня уже есть, наверно, это какая- то ошибка). И наоборот, чем переболевших больше, тем значительнее шанс, что, если вы получили отрицательный результат, он будет ложным (у всех уже есть антитела, а у меня нет, как так, это явно ошибка).

Чтобы оценить диагностическую ценность положительного (PPV, positive predictive value) и отрицательного (NPV, negative predictive value) результата, не проводя вручную все те расчеты, что мы проделали выше, ученые и медики используют специальные формулы, учитывающие чувствительность и специфичность конкретного теста и прикидочную распространенность заболевания (ведь точную мы не знаем, потому что идеальных тестов, которые бы давали нулевую ошибку, не существует). Для наших примеров с 5% и 50% процентами переболевших в Москве диагностическая ценность положительного результата теста с чувствительностью 99% и специфичностью 98% составляет соответственно 72% и 98%. То есть, когда вокруг болеет мало народу, шанс, что человек, который получил положительный результат, действительно перенес COVID-19, составляет примерно 7 из 10. Когда переболел каждый второй, положительный результат — это почти гарантированно истинный «плюс». Диагностическая ценность отрицательного результата составляет при 5%- ной распространенности 99,9%, при 50%- ной — 98,9%. Если в нашей гипотетической Москве переболеет 80% жителей, диагностическая ценность отрицательного результата все равно составит уверенные 96%, а положительного — 99%.

Еще немного деталей

На самом деле все еще сложнее, и заявленные производителями чувствительность и специфичность серологических тестов могут в реальности быть гораздо ниже, потому что для проверки, истинен или ложен выдаваемый тестом результат, необходимо точно знать, кто болел коронавирусом, а кто нет. С проверкой на специфичность все относительно просто — обычно для этого используют донорскую кровь, сданную несколько лет назад, когда никакого SARS- CoV-2 еще не было. С чувствительностью дела обстоят сложнее. Положительный ответ не обязательно означает, что человек переболел именно COVID-19 — антитела к другим коронавирусам тоже могут цепляться за размещенные в лунке кусочки белков SARS- CoV-2 и давать сигнал. Поэтому просто использовать в качестве положительного контроля людей, у которых COVID-19 был подтвержден РНК- тестом, не получится: во-первых, они вполне могли недавно переболеть еще и коронавирусной простудой, а во-вторых, мы сегодня знаем, что у части выздоровевших от COVID-19 не вырабатывается достаточного количества антител. Так что разработчикам приходится долго и муторно проверять, что выдаваемый их серологическим тестом положительный сигнал не кросс- реактивность к другим коронавирусам. Кроме того, очень желательно иметь клинические данные пациентов, чтобы подкрепить положительный результат теста, например, данными КТ. С генетическим тестом тоже приходится повозиться: для адекватного подтверждения, что положительный ответ действительно говорит о присутствии в образце вирусной РНК, нужно либо выделять вирус — а это требует лаборатории класса BSL-3, либо иметь подробные клинические данные тестируемых добровольцев.

Издательство: Альпина нон-фикшн

Когда первые несколько тестов появляются на рынке, история становится совсем запутанной. У производителей каждого следующего набора для анализа велик соблазн не заморачиваться всеми этими сложными проверками, а сравнить свой тест с уже имеющимся. Кроме того, в некоторых странах (в том числе в России) таковы требования регистрирующих органов. И если выбранный вариант тест- системы врет — например, ее чувствительность сильно ниже заявленной, то правильно определенные новым тестом инфицированные будут записаны в ложноположительные результаты. Через некоторое время разобраться, какой же тест хороший, а какой нет, становится практически нереально. Именно так произошло в США, и теперь, чтобы разрулить ситуацию, тем же самым регулирующим органам придется в нее активно вмешиваться.

Кроме того, любые тесты, разработанные и проверенные в популяциях, где та или иная болезнь распространена широко, при использовании в обществах, где ее меньше, могут давать заниженную чувствительность по причинам, которые мы обсудили в основном тексте этой главы. В идеале тест должен разрабатываться и проверяться там, где его планируется использовать (и «подправляться» по мере того, как распространенность болезни растет или снижается), но это не всегда возможно, так как во многих странах нет достаточного числа специалистов и производственных мощностей.

Оформить предварительный заказ книги можно по ссылке

Больше текстов о политике и обществе — в нашем телеграм-канале «Проект "Сноб" — Общество». Присоединяйтесь

Обсудить на сайте