Оценка эффективности диагностических
исследований1
Лучевая диагностика, в распоряжении которой широкий ассортимент методов исследования — дешевых и дорогостоящих, инвазивных и необременительных для больного, высокоинформативных и ограниченной информативности,— ставит врача-диагноста перед выбором: как обеспечить наиболее высокую эффективность диагностического процесса, каким методам отдать предпочтение, в какой комбинации и последовательности их применить. Очевидно, что подходы к диагностике будут значительно различаться в зависимости от того, имеет место острое или хроническое заболе-
1 Подробнее см.: Власов В.В. Эффективность диагностических исследований. — М: Медицина, 1988.
Рис. 1.13. Структура телекоммуникационной радиологической сети.
вание, проводят плановое обследование или оказывают неотложную медицинскую помощь, выполняют детальное и углубленное обследование или организуют скрининг, охватывающий значительную часть населения. Во всех этих ситуациях необходимо уметь правильно оценивать эффективность метода диагностики, причем сделать это нужно на объективной, научной основе.
Для оценки эффективности диагностических исследований существует большое число критериев. Многие из них универсальны, т.е. применимы во всех областях клинической медицины, другие, характеризующие медицинские изображения, имеют специфическое для лучевой диагностики значение.
Под диагностической эффективностью метода исследования следует понимать способность данного метода (теста) выявить заболевание и охарактеризовать состояние организма при экономической доступности метода.
В лучевой диагностике выделяют качественную, или описательную, и количественную характеристики результатов. Последняя включает в себя различные виды измерений: радиоактивности биологических проб, величины органов, изображенных на экране дисплея, рентгеновской пленке, компьютерной томограмме и др. Все эти измерения, как бы точны они ни были, обязательно имеют некоторую степень погрешности. Это связано как с ограниченной точностью инструментов, с помощью которых проводят
измерения (линейка, электронный прибор или другие технические средства) такие вариабельностью измеряемого объекта: колебаниями биологических параметров человека во время исследования, флюктуациями радиоактивного распада, неоднородностью потока электромагнитных квантов
Перечисленные выше погрешности имеют случайный характер. Их влияние на точность измерения может быть уменьшено, если увеличить количество измерений объекта исследования или увеличить продолжительность каждого измерения. Погрешности такого рода называют случайными, или рандомизированными, ошибками.
Погрешности другого типа возникают при неправильной работе аппаратуры, калибровке лабораторного оборудования, технологии приготовления радиофармпрепаратов или химических растворов, вследствие ошибок, допущенных в расчетах. Конечные результаты подобных измерений во всех случаях оказываются либо завышенными, либо заниженными, т.е. всегда однозначно искаженными. Подобные погрешности носят название «систематические ошибки». Единственный способ избежать этих погрешностей — тщательно контролировать качество технических средств лучевой диагностики, следить за правильностью проведения диагностических процедур, корректно выполнять расчеты.
Для оценки эффективности методов измерения в лучевой диагностике, как и в других разделах медицины и биологии, применяют ряд критериев, главными из которых являются:
• точность измерения — соответствие результатов измерения истинному значению определяемой величины. Высокая точность измерения достигается при минимальных случайных и систематических погрешностях;
• правильность измерения. Это качество измерения характеризует величину систематических погрешностей. Чем они меньше, тем более правильным оказывается измерение;
• сходимость измерений. Данное качество измерений характеризует величину случайных ошибок. Чем они меньше, тем лучше сходимость измерений. Этот критерий показывает, насколько близки друг к другу измерения, выполненные в одинаковых условиях, т.е. в одной и той же лаборатории и на одном и том же приборе;
• воспроизводимость измерений. Этот критерий показывает, насколько близки между собой результаты измерений, выполненных в различных условиях, т.е. в разных лабораториях и на разных аппаратах.
Для того чтобы оценить диагностическую эффективность лучевого метода исследования, сравнивают его информативность, т.е. способность распознавать заболевание, с так называемым референтным, или эталонным, диагнозом. Этот диагноз устанавливают на основании результатов гистологического исследования или вскрытия либо с учетом точных биохимических или клинических признаков болезни. Патологоанатомические данные иногда называют «золотым стандартом» при верификации диаг-ноза.
Для оценки информативности метода результаты его применения у определенной группы пациентов сводят в таблицу, называемую матрицей решений (табл. 1.2). При этом в зависимости от совпадения результатов луче-
вого исследования и фактического наличия заболевания, т.е. референтного диагноза, ответ может оказаться правильным или неправильным. Возможны следующие варианты результатов оценки метода:
• интерпретация «положительный» у больных с наличием заболевания — истинно положительные случаи;
• интерпретация «отрицательный» у пациентов без заболевания (здоровые лица) — истинно отрицательные случаи;
• интерпретация «положительный» у пациентов, не имеющих заболевания,— ложноположительные случаи (ошибки первого типа, или ошибки гипердиагностики, или «ложные тревоги»);
• интерпретация «отрицательный» у больных с заболеванием Щ ложноотрицательные случаи (ошибки второго типа, или ошибки ги под и а гностики, или «пропуски»).
Ложноположительные и ложноотрицательные ошибки представляют собой потери системы диагностики, они снижают диагностическую эффективность исследования.
Таблица 1.2. Матрица решений для вычислений операционных характеристик методов диагностики
Результаты теста | Заболевание имеется (больные) | Заболевание отсутствует (здоровые) | Всего |
Положительные Отрицательные И то го... | Истинно положительные (ТР) Ложноотрицательные (FN) D+ | Ложноположительные (FP) Истинно отрицательные (TW) D- | Т+ т- N |
В медицине информативность диагностических исследований оценивается следующими основными критериями.
Чувствительность (SJ — вероятность положительного результата теста у лиц с заболеванием:
Число пациентов с данным заболеванием и положительным результатом теста
Чувствительность, % =-------------------- ——------------------- -—Р х 100.
Число всех пациентов с данным заболеванием, подвергшихся тесту
Определив чувствительность метода, можно априори предположить, какова будет доля больных, у которых данное исследование даст положительный результат, т.е. будет выявлен признак болезни. Чем выше чувствительность метода, тем чаще с его помощью выявляют патологические изменения, тем, следовательно, он более эффективен. В то же время если такой высокочувствительный тест отрицателе», то наличие заболевания маловероятно, поэтому высокочувствительные тесты в медицинской диагностике называют идентификаторами, или тестами на исключение заболевания.
Высокочувствительные тесты эффективны на первом этапе диагностики, когда врачу необходимо отбросить массу первоначальных предположений ^ги тесты рекомендуется использовать при массовых проверочных исследованиях, особенно при выявлении социально опасных заболеваний.
Недостатком высокочувствительных методов является то, что при их использовании допускают значительное количество ложноположительных ошибок (ложные тревоги). В связи с этим возникает необходимость выполнять большое число дополнительных исследований, вследствие чего усложняется диагностический процесс и увеличиваются экономические затраты, особенно при массовых исследованиях. Вот почему в медицинской диагностике следует стремиться не к максимальной, а к разумно достижимой чувствительности метода.
Специфичность (SJ — вероятность отрицательного результата у лиц без
заболевания:
Число пациентов без данного заболевания
с отрицательным результатом теста
Специфичность, % —--------------------------------------------------- х 100 •
Число всех пациентов без данного
заболевания, подвергшихся тесту
Определив специфичность метода, можно априори предположить, какова будет доля здоровых лиц, у которых данное исследование даст отрицательный результат. Чем выше специфичность метода, тем надежнее с его помощью подтверждается заболевание, т.е. он более эффективен. Высокоспецифичные диагностические тесты называют дискриминаторами; они эффективны на втором этапе диагностики, когда крут предполагаемых заболеваний сужен и необходимо с уверенностью доказать наличие болезни.
Точность (epsilonx) — пропорция правильных результатов (положительных и отрицательных) среди всех обследованных:
Число истинных решений
Точность =-------------------------- ———
Общее число обследованных
Иногда этот критерий называют показателем диагностической эффективности.
Все три критерия — чувствительность, специфичность и точность — отражают априорную вероятность результатов диагностического исследования — положительных и отрицательных. Они носят название «операционные характеристики метода диагностики*. Применяя операционные характеристики метода на практике, врач должен учитывать особенности обследуемых больных. Если метод применяют при обследовании больных с клинически выраженным заболеванием, то операционные характеристики его будут высокими, и наоборот, в начальных и особенно доклинических стадиях болезни чувствительность и специфичность метода окажутся пониженными. Следовательно, для каждой стадии болезни будут свои операционные характеристики метода исследования.
Для правильной оценки диагностической эффективности методов исследования важное значение имеют критерии апостериорной вероятности - прогностичность положительного (PV+) и отрицательного (PV-) результатов. Именно эти критерии показывают, какова вероятность заболевания (или его отсутствия) при известном результате исследования. Нетрудно понять, что апостериорные показатели имеют большее практическое значение, чем априорные.
Критерий PV+ показывает, насколько велика вероятность болезни при положительных результатах исследования, а критерий PV- — насколько велика вероятность отсутствия болезни при отрицательных результатах.
Прогностичность положительного результата возрастает с увеличением частоты заболевания. Это означает, что один и тот же метод лучевого исследования, у которого определены операционные характеристики, будет по-разному «работать» в различных лечебных учреждениях: общего профиля, специализированных (с высокой частотой заболевания) и в условиях скрининга (низкая частота заболевания). Из сказанного следует важнейшее правило диагностики: эффективность диагностического исследования необходимо оценивать только с учетом частоты выявляемого заболевания, т.е. конкретных условий применения данного метода исследования. Например, информативность рентгенографии грудной клетки будет различной в зависимости от того, где и с какой целью ее проводят: при массовых проверочных исследованиях, в лечебном учреждении общего профиля или в онкологическом диспансере.
Давая оценку диагностической эффективности метода исследования, обычно указывают на общее количество ошибочных заключений: чем их меньше, тем эффективнее метод. Однако, как уже отмечалось, одновременно уменьшить количество ложноположительных и ложноотрицательных ошибок нереально, поскольку они связаны между собой. Кроме того, принято считать, что ошибки первого типа — ложноположительные — не так опасны, как ошибки второго типа — ложноотрицательные. Это особенно относится к выявлению инфекционных и онкологических заболеваний: пропустить болезнь во много раз опаснее, чем диагностировать ее у здорового человека.
6 тех случаях, когда результаты диагностического исследования выражают количественно, их классифицируют на норму и патологию условно (рис. 1.14). Часть значений теста, принимаемых за норму, будет наблюдаться у больных, и, наоборот, в зоне патологии окажутся некоторые изменения у здоровых. Это и понятно: ведь граница между здоровьем и начальной стадией болезни всегда условна. И все же в практической работе, анализируя цифровые показатели диагностического исследования, врач вынужден принимать альтернативные решения: отнести данного пациента к группе здоровых либо больных. При этом он пользуется разделительным значением применяемого теста.
Изменение границы между нормой и патологией всегда сопровождается изменением операционных характеристик метода. Если к методу предъявляются более жесткие требования, т.е. граница между нормой и патологией устанавливается на высоких значениях теста, увеличивается число
Совокупность заболевания
Рис. 1.14. Распределение вероятностей нормы и патологии.
а — ложноположительные решения; р — ложноотриндтельные решения, х — граница между нормой и патологией.
ложноотрицательных заключений (пропусков заболеваний), что приводит к повышению специфичности теста, но одновременно к снижению его чувствительности. Если целесообразно смягчить требования к тесту, границу между нормой и патологией сдвигают в сторону нормальных значений, что сопровождается увеличением числа ложноположительных заключений (ложных тревог) и одновременно уменьшением числа ложноотрицательных (пропусков заболеваний). При этом повышается чувствительность метода, но снижается его специфичность.
Таким образом, проводя диагностические исследования и оценивая их результаты количественно, врач всегда находится в условиях выбора: то жертвует чувствительностью, чтобы повысить специфичность, то, наоборот, отдает предпочтение специфичности за счет снижения чувствительности. Как правильно поступать в каждом конкретном случае, зависит от многих факторов: социальной значимости заболевания, его характера, состояния больного.
Из изложенного следует важнейший для современной медицинской диагностики, в том числе лучевой, вывод: количественный математический метод, каким бы совершенством ни отличались математический аппарат или используемые технические средства, всегда имеет ограниченное, прикладное значение, подчиняясь логическому мышлению врача и соотносясь с конкретной клинической и социальной ситуацией.
Для того чтобы оценить диагностическую эффективность метода с учетом последствий ложных решений, используют характеристические кривые, отражающие взаимную зависимость ложноположительных и истинно положительных результатов. Полное название таких кривых — «операционные характеристические кривые наблюдателя» (Receiver• operating characteristic curve, сокращенно ROC-curve), поэтому часто такие кривые называют ROC-кривыми, а выполняемые для их построения действия — ROC-анализом.
0,1 0,2 ОД 0,4 0,5 0.6 0,7 0,8 0,9 1,0 Р (S/n) Рис. LIS. ROC-кривые (1—3) трех серий опытов. P(S/s) — истинно положительные случаи; P(S/n) — ложноположительные случаи. Наиболее информативен опыт 3. |
С целью построения характеристических кривых результаты обследования верифицированной группы больных и здоровых распределяют в несколько групп. Если эти результаты имеют количественный характер, то их ранжируют по значению точки разделения на норму и патологию. Качественные же результаты применения изучаемого метода (например, описание рентгенологической или сцинтиграфической картины) ранжируют по степени уверенности врача в диагнозе. Полученные таким образом данные сводят в таблицы и по ним строят характеристические кривые — ROC-кривые (рис. 1.15). Чем больше изгиб характеристической кривой, т.е. чем ближе к верхнему левому углу системы координат она расположена, тем выше эффективность диагностического метода. Приближение же ROC-кривой к диагонали, проходящей через начало координат, свидетельствует о низкой эффективности метода исследования.
Характеристические кривые позволяют наглядно сопоставить диагностическую эффективность различных методов исследования при обнаружении одного и того же поражения. Кроме того, с их помощью можно оценить качество средств визуализации: рентгеновских экранов, дисплеев, твердых копий медицинских изображений (рентгенограмм, сцинтиграмм и др.). С этой целью организуют группу экспертов — специалистов в области лучевой диагностики, которым предъявляют для анализа серию верифицированных медицинских изображений. Ответы экспертов кодируют по указанной выше 5-балльной системе и на основании полученных данных строят характеристические кривые каждого изучаемого метода. Тот метод, у которого ROC-кривая имеет больший изгиб и расположена ближе к верхнему левому углу системы координат, имеет более высокую диагностическую эффективность.
Интересно, что метод ROC-анализа и построение ROC-кривых дают возможность оценить профессиональные навыки и квалификацию специалистов. С этой целью врачу предъявляют для опознания верифицированный архив медицинских изображений (рентгенограмм, сцинтиграмм и др.). Так же как и в предыдущем случае, ответы врача соответствующим образом ранжируют и по полученным данным строят характеристические кривые. У квалифицированного специалиста ROC-кривая имеет крутой изгиб, она вплотную приближена к верхнему левому углу системы координат.
Для того чтобы оценить вклад лучевой диагностики, как и диагностики вообще, в медицинскую практику, используют следующие комплексные критерии.
Результативность метода - это вероятность получения у отдельного пациента или популяции в целом положительного результата от применения данной технологии в усредненных условиях*
Эффективность метода - оценка мастерства врача, с которым он использует имеющиеся ресурсы для решения данной проблемы. В частности, эффективность процедуры получения диагностического изображения считают высокой, если наибольшее число истинно положительных и/или истинно отрицательных результатов получено при наименьших затратах (имеются в виду деньги, ресурсы, время).
Сила метода — это способность диагностического теста, примененного в оптимальных условиях, влиять на решение врача, касающееся диагноза и ведения больного (лечение, реабилитацию), т.е. влиять на здоровье как отдельного пациента, так и населения в целом.
Понятно, что результативность метода всегда будет ниже, чем его сила, поскольку она зависит от мастерства специалиста, обеспечивающего получение диагностического изображения, а также потому,*что инфраструктура в усредненных условиях отнюдь не соответствует таковой в оптимальных условиях.
Дата добавления: 2015-06-12; просмотров: 8646;