Математика, стоящая за тестированием на ВИЧ и не только

Сделала важное дополнение к посту про SafeBox и вынесу из него кусок медицинской статистики, которую иногда не понимают даже профессионалы-медики. Вот тот же тест OralQuick HIV имеет, по данным FDA, чувствительность 92% и селективность 99,8% – это значит, что у 1 из 12 ВИЧ+ людей будет ложноотрицательный результат, а на 5000 ВИЧ-отрицательных тестируемых – один ложноположительный.

Теперь зададимся важным вопросом: предположим, у вас появилось две полоски – какова вероятность того, что вы ВИЧ-положительны? Напрашивающийся ответ 99,8% – неверен, и точно так же можно сказать про тесты на другие заболевания. В чём дело?

Смотрите: у нас есть, к примеру, миллион человек и из этого миллиона ВИЧ-инфицирован один процент, то есть 10 тысяч, это типичная для России картина. Тест, имеющий заявленные выше показатели, найдёт в первую очередь 9200 людей с ВИЧ, отказав в 800 (8%) случаях из 10 000. Далее у нас есть 990 тысяч ВИЧ-отрицательных людей и у каждого пятитысячного тест даёт ложноположительный результат – итого получаем 198 человек.

Всего с двумя полосками тест видят 9200 + 198 = 9398 человек и 9200 действительно ВИЧ-инфицировано. Иными словами, если у вас тест сработал и показал положительный результат, вы с вероятностью 97,89% действительно инфицированы. Это много, но это 49 из 50, а не 1 из 5000.

Для совсем не дружащих с математикой – прокрутите вниз поста, там простыми словами самое важное.

Если вы живёте, скажем, в Японии или Китае (где ВИЧ-положительное население составляет порядка 0,1%) то мы получим такие цифры:

– на миллион человек тест правильно находит 920 ВИЧ-положительных пациентов/ок;
– на 999 тысяч ВИЧ-отрицательных людей мы получаем 200 ложноположительных результатов;
– на 920+200 = 1120 положительных тестов мы имеем 200 ошибок, это означает уже 82,14% вероятность того, что две полоски и вправду соответствуют ВИЧ+ статусу.

Как можно видеть, чем реже встречается то, что мы ищем – тем ниже вероятность того, что положительный результат и вправду положительный. По этой причине подобные ВИЧ-тесты очень хороши при сравнительно высоком уровне заражения, а вот скрининговые программы для выявления не самых частотных онкологических заболеваний зачастую оказываются неудачны. Взять, к примеру, злокачественные опухоли в костной ткани: их в США выявляют примерно с десяток на миллион человек в год; тест с заявленными выше параметрами с одной стороны выявит большую часть заболевших, а с другой стороны – на десяток реальных больных придётся двести ложноположительных результатов; вот тут уже очень важно понимать основы статистики и не говорить пациенту “мне жаль, но тест ошибается в одном случае из пяти тысяч”.

Можно посчитать и вероятность того, что отрицательный результат SafeBox не отрицателен вовсе. Для населения в целом: мы снова имеем 9398 положительных (реально и ложно) тестов на миллион человек и, следовательно, 990602 отрицательных результатов. Из этих 990602 отрицательных тестов будет 200 таких, которые не выявили ВИЧ-инфекцию: это соответствует 0,02%. Иными словами, отрицательный тест даёт 99,98% гарантию ВИЧ-отрицательного статуса… при, подчеркну, одном проценте заражённых среди всех пользователей.

Для групп риска (скажем, мужчины, имеющие секс с мужчинами и часто менявшие партнёров) картинка будет иной. Если, скажем, заражено 20% – то математика такова:

– на миллион человек приходится двести тысяч инфицированных и в 184 тысячах случаев тест правильно их выявляет;
– мы имеем 800 тысяч ВИЧ-отрицательных человек и 160 ложноположительных результатов;
– положительный тест будет у 184160 из миллиона; в 99,91% случаев эти две полоски действительно будут означать ВИЧ+ статус;
– отрицательный тест получат 815840 человек (реально ВИЧ- и те ВИЧ+, у которых тест ошибся) и из них 16000 на самом деле окажутся инфицированы; в 98,03% случаев отрицательный тест действительно отрицателен.

Если вы где-то потеряли нить и смысл вычислений от вас ускользает, выпишу самое важное:

  • положительный результат любого медицинского теста, про который сказано “даёт ложный положительный результат в 1 случае из 5000” будет в большинстве случаев не столь однозначен, речь не идёт о том, что ваши шансы оказаться ложно диагностированной составляют 1 к 5000.
  • чем реже болезнь или состояние, которое призван выявить тест – тем выше вероятность того, что ваш положительный результат есть следствие ошибки. Когда вы ищите что-то редкое, истинный положительный результат теряется в ложных срабатываниях.
  • при распространённости ВИЧ-инфекции на уровне от 1 до 20% (первая цифра – по России, вторая может отражать некоторые группы риска, но мы точно не знаем) результатам теста, в общем, можно верить. При очень высоком инфицировании вырастет риск ложноотрицательного результата, при очень низком – ложноположительного.

Ну а кому хочется, напротив, серьёзной математики – читайте про теорему Байеса.

Tagged . Bookmark the permalink.

Leave a Reply

Your email address will not be published. Required fields are marked *