Внедрение рентгенологического исследования в качестве диагностического метода было важной вехой в изучении туберкулезной инфекции у человека и совершенствовании ее диагностики. Поэтому неудивительно, что энтузиазм, с которым была встречена и применена рентгенография, нередко способствовал переоценке значимости этого метода. До настоящего времени широко распространено представление о том, что туберкулез легких можно диагностировать только на основании одних лишь рентгенограмм. Однако практический опыт и результаты многих специальных исследований показали, что не существует рентгенологической картины, абсолютно типичной для туберкулеза. При многих заболеваниях легких наблюдаются рентгенологические изменения, которые могут быть неотличимы от картины легочного туберкулеза. Кроме того, поражения при туберкулезе легких могут проявляться самыми разнообразными рентгенологическими изменениями .
Несомненно, что результаты рентгенологического исследования органов грудной клетки могут иметь очень большое значение в определении локализации патологических изменений. Однако для подтверждения туберкулезной этиологии выявленных изменений необходимы дополнительные исследования, а окончательная диагностика возможна только на основании результатов бактериологического исследования мокроты.
Ошибка исследователя
Многие широко распространенные клинические и лабораторные тесты, считающиеся точными и объективными, фактически в той или иной степени субъективны и могут быть ошибочно истолкованы исследователем. Примерами подобных тестов являются определение артериального давления, ЭКГ, неавтоматизированный подсчет клеток крови, эндоскопия, визуальные колориметрические тесты, а также рентгенография грудной клетки. Ценность результатов рентгенологического исследования органов грудной клетки в значительной мере зависит от умения человека, производящего это исследование, выявлять патологические очаги затемнения и правильно их интерпретировать. Речь идет не только о том, что рентгенолог не должен пропускать имеющиеся очаги, но и о том, что специалист не должен допускать гипердиагностики. Качество интерпретации рентгенограмм существенно зависит от индивидуальных особенностей специалиста; разные рентгенологи могут по-разному «прочитать» одну и ту же рентгенограмму (это так называемая вариабельность результатов, полученных разными специалистами). Однако может случиться и так, что один и тот же специалист по-разному описывает одну и ту же рентгенограмму (индивидуальная вариабельность).
Масштабы ошибок исследователя при трактовке рентгенограмм были изучены несколько десятилетий назад, когда во многих промышленно развитых странах было начато осуществление программ борьбы с туберкулезом. Значительная часть ранних исследований, выполненных Йерушалми (Ует8иа1шу) — специалистом по биологической статистике, — была направлена на изучение эффективности различных рентгенологических и флюорографических методов и оборудования.
Гипер-и гиподиагностика
Одно из предпринятых исследований проведено с целью установить влияние размеров рентгенограммы грудной клетки на результаты ее расшифровки. При этом исходили из предпосылки, что эти вариации играют гораздо меньшую роль, чем индивидуальные факторы рентгенолога . Каждый из пяти участвовавших в исследовании специалистов не замечал (или просматривал) изменения на рентгенограммах примерно в 25% случаев (табл. 15). Когда спустя 3 месяца те же самые рентгенограммы повторно рассматривались теми же специалистами, то в 20% всех случаев они изменили свое первоначальное заключение относительно обнаруженных изменений (индивидуальная вариабельность результатов).
Дополнительные исследования подтвердили, что в 26—43% случаев может иметь место гиподиагностика [3, 7, 8]. Например, в Дании группа из трех опытных специалистов провела независимую оценку 5 000 неотобранных флюоро-грамм (см. табл. 15). Было установлено, что в среднем гиподиагностика имела место в 32% случаев, а гипердиагностика — в 2%. Эти наблюдения были затем подтверждены в Великобритании [ 10].
Большое исследование, проведенное в США, имело целью установить целесообразность периодических массовых флюорографий [4, 6]. Обследовано 15 000 студентов первого курса университета (см. табл. 15). Расшифровку флю-орограмм выполняли 50 специалистов (25 рентгенологов и 25 пульмонологов). Каждый участник исследования оценивал 3 000 флюорограмм, отобранных методом случайной выборки — таким образом, каждая флюорограмма была независимо «прочитана» 10 раз. Каждого студента, флюорограмма которого была расценена как положительная хотя бы одним специалистом, обследовали до
|
Таблица 15 Ошибка исследователя: гиподиагностика и гипердиагностика при рентгенологическом исследовании органов грудной клетки (в основном результаты исследования, взятые наугад) |
полнительно (культуральное исследование мокроты, туберкулиновые тесты и томография) и в дальнейшем наблюдали в течение всего времени учебы в университете. В конечном итоге небольшая группа экспертов, которые располагали всей необходимой информацией, оценила 249 флюорограмм как «несомненно положительные». Вариабельность результатов, полученных разными специалистами, была весьма значительной. При анализе результатов работы всех 50 специалистов было установлено, что гиподиагностика имела место в 39% случаев (249 «определенно положительных» флюорограмм). В противоположность этому гипердиагностика отмечена в 1,2% случаев (156 флюорограмм). Если принимать во внимание заключения только 10 «лучших» специалистов (5 рентгенологов и 5 пульмонологов), то частота гипо - и гипердиагностики будет значительно ниже, но все-таки еще достаточно высокой (см. табл. 15).
|
Таблица 16 Ошибка исследователя: гиподиагностика и гипердиагностика при интерпретации флюорограмм грудной клеткиаб |
Влияние опыта специалиста на результаты интерпретации рентгенологических данных
Исследование гипо - и гипердиагностики туберкулеза было проведено сотрудниками Научно-исследовательского института туберкулеза Токио. Анализ результатов интерпретации флюорограмм выполняли 192 врача, участвовавшие в Японской национальной программе выявления больных туберкулезом [ 11]. Особое внимание при этом уделяли корреляции результатов и опыта «чтения» рентгенологических данных (табл. 16).
Для независимой оценки были использованы флюорограммы 50 человек, состояние здоровья которых было хорошо известно организаторам исследования: 25 больных с подтвержденным диагнозом туберкулеза или других заболеваний легких, 5 человек с излеченным туберкулезом и 20 человек без какой-либо рентгенологической патологии. Специалисты, принимавшие участие в исследовании, имели опыт работы от менее 1 года до 10 лет и более и ежегодно смотрели от 1 000 до 20 000 снимков (см. табл. 16). Они должны были ответить только на один вопрос — нужно ли проводить дополнительное обследование этих людей. Если специалист не считал необходимым дополнительное обследование больного с патологией легких, то такую ситуацию расценивали как случай гиподиа-гностики. Заключение о необходимости дополнительного обследования человека без какой-либо рентгенологической патологии расценивали как случай гипердиагностики.
Частота гиподиагностики составила в среднем 21,8%, а гипердиагностики — 19,5%. Однако частота гиподиагностики у специалистов с опытом работы более 10 лет или у ежегодно «читающих» более 20 000 флюорограмм была ниже на 6—8% по сравнению с менее опытными врачами. Не было ни одного специалиста, который не сделал бы как минимум двух ошибок. Исследователи пришли к выводу, что в Японии при осуществлении массовой флюорографии не диагностируется каждый пятый случай активного туберкулеза легких.
Расхождения результатов интерпретации повторных рентгенограмм грудной клетки
|
Таблица 17 Расхождение результатов интерпретации рентгенограмм грудной клетки у 900 пациентов3 |
Расхождения результатов «чтения» флюорограмм разными специалистами были отмечены не только при использовании этого метода для выявления больных и диагностики туберкулеза, но и при интерпретации результатов серийных рентгенограмм в процессе наблюдения за одними и теми же больными. Например, в одном из исследований Каждого больного обследовали двукратно с различными интервалами (всего было изучено 9 тыс. пар снимков размерами 35,6 см • 43,0 см). Специалистам был задан вопрос о динамике выявленных изменений (наблюдается ли у больного улучшение, ухудшение или отсутствуют какие-либо изменения?). Результаты этого исследования представлены в табл. 17. Независимо от того, кто производил учет результатов (2 группы, состоявшие из 3 рентгенологов или 3 пульмонологов, или только 2 эксперта), были получены сходные данные. Расхождения результатов были отмечены в 27—30% случаев. Кроме того, отдельные специалисты в 19—24% случаях иначе оценивали свои же собственные описания рентгенограмм.
Исследование Международного Союза борьбы
С туберкулезом (IUAT) рентгенологической классификации
Изменений на снимках грудной клетки
Международный союз борьбы с туберкулезом (ШАТ) организовал одно из наиболее важных широкомасштабных сравнительных исследований по расшифровке и интерпретации рентгенограмм грудной клетки. Основной целью этого исследования была разработка унифицированной номенклатуры и единой системы интерпретации рентгенологических данных, которые могли бы стать основой для создания международной классификации рентгенологических изменений в легких [ 12, 13].
Из нескольких сотен тысяч снимков, сделанных во время массовых рентгенологических обследований взрослого населения Норвегии, были отобраны 1 100. В этот набор вошли 200 снимков от больных с заразными формами туберкулеза легких, 400 снимков от больных с ранее перенесенным активным туберкулезом, 100 снимков от больных с минимальными изменениями, не требующими дополнительных консультаций или обследований, 300 снимков от людей без патологических изменений в легких и 100 снимков от пациентов с различными поражениями легких нетуберкулезной этиологии. Эти снимки были сгруппированы в 7 роликов, и с каждого ролика было сделано по 10 копий.
Учет результатов выполняли 90 врачей (рентгенологи и пульмонологи), имевших достаточные навыки этой работы. Восемьдесят экспертов работали в 9 странах (Чехословакия, Дания, Финляндия, Франция, Норвегия, Швеция, Великобритания, США и Югославия)1, где массовые флюорографические исследования выполнялись уже в течение многих лет. Десять экспертов были отобраны из числа специалистов, принимавших участие в различных национальных и международных проектах, осуществляемых ВОЗ.
Исследование было запланировано таким образом , чтобы в первую очередь определить частоту совпадения или расхождения результатов между отдельными специалистами, а не устанавливать величину «ошибки исследователя» типа гипо - или гипердиагностики . Каждый специалист должен был самостоятельно ответить на ряд вопросов, подготовленных заранее. Большинство вопросов предусматривали только два варианта ответа — «да» или «нет». Например: «Имеются ли на снимке легких патологические изменения?»; «Имеется ли в данном случае каверна?»; «Должен ли клиницист уделить данному больному внимание?»
Оценка полученных данных была проведена с помощью специальной статистической методики , при которой для каждого вопроса была получена серия величин. На основании этих величин были построены кривые, которые характеризовали уровень расхождения между различными специалистами при ответе на данный вопрос (рис. 3). Преимуществом этого метода является то, что построенная таким образом кривая могла быть представлена одним рисунком — индексом. Этот индекс мог принимать любые значения в интервале от 0 до 100, отражая степень несогласия (индекс 0 означал отсутствие расхождений, а значение 100 указывало на полное расхождение). Наибольшее приближение
ВЫЯВЛЕНИЕ И ДИАГНОСТИКА
Кривой к пункту 0 по обеим осям отражало минимальную частоту расхождений. Отклонение кривой или же ее удаление от одной из осей указывало на возрастающую частоту расхождений в оценках. Как показал этот метод, частота расхождений в ответах на первый из поставленных вопросов была заметно меньше, чем в ответах на третий вопрос.
Рис. 3
Расхождение между специалистами по классификации рентгенограмм3
(исследование ЮАТ).
Индекс расхождений по трем вопросам:
1. Имеется ли какая-либо патология органов дыхания?
2. Имеется ли какая-либо патология в лимфатических узлах?
3. Имеются ли какие-либо обызвествления в лимфатических узлах?
Индекс рассчитывался как суммарный процентный показатель расхождений в ответах, эквивалентный соответствующей точке на кривой, т. е. там, где кривая пересекает косую линию, исходящую из угла с точкой 0.
Сравнение степени расхождения в интерпретации рентгенограмм грудной клетки и бактериоскопии мазков мокроты
Подобное исследование было проведено ШЛТ для оценки степени расхождения между бактериологами, исследовавшими мазки мокроты на содержание КУМ (Дж. Найбой (Т. МуЪое), неопубликованные данные, 1971 г.). Серия из 250 образцов мокроты была исследована независимо в 10 лабораториях опытными специалистами-лаборантами. На рис. 4 показаны кривые расхождения трех критериев положительных результатов. Степень расхождения была наименьшей (индекс 10), когда критерий положительного результата был по меньшей мере 8 КУМ; он был немного выше (индекс 12), если, как минимум, требовалось 3 КУМ. Степень расхождения была наивысшей (индекс 18), когда критерием положительного результата была 1 КУМ. Тем не менее даже самая высокая степень расхождения между специалистами-лаборантами была значительно меньше, чем самая низкая степень между специалистами-рентгенологами.
Рис. 4
Примеры кривых расхождений при рентгенологических и бактериологических исследованиях
Кривая 1 на рис. 4 иллюстрирует самый низкий уровень расхождения (индекс 28), отмеченный при ответе на вопрос «Имеется ли каверна?». Гораздо более низкие показатели расхождений имеют место при ответе на вопрос «Имеются ли в мазке мокроты КУМ?», даже при лимите, равном одной кислото устойчивой бактерии. Исследователи пришли к заключению о значительно большей согласованности среди специалистов в трактовке результатов бактериоскопии мазков мокроты вне зависимости от принятых при этом критериев, чем среди рентгенологов (см. главу 5 «Насколько достоверны результаты бактериоскопического исследования мазков мокроты?»).
Уровни расхождения при интерпретации рентгенограмм органов грудной клетки и выводы
В табл. 18 приведено несколько индексов расхождения, полученных при анализе ответов на некоторые другие вопросы. Выбор вопросов определялся их значением для правильной классификации рентгенологических данных. В таблицу включены вопросы, по которым были отмечены максимальные и минимальные несовпадения результатов.
|
Таблица 18 Международное исследование IUAT, проведенное по рентгенологической классификации: индексы расхождения по разным вопросам3 |
Совершенно неожиданной была высокая степень несовпадения результатов при ответе на вопрос о наличии патологических изменений в легких. Также вызывает удивление частое расхождение ответов на вопрос о наличии в легких кальцинатов. Особенно удручающим был значительный разброс ответов на вопрос о наличии патологических изменений в лимфатических узлах, включая их обызвествление (одна из наиболее частых рентгенологических находок). Наибольшее совпадение (или наименьшее расхождение оценок) отмечено при ответах на вопрос о наличии каверн в легких. Эту информацию следует рассматривать в контексте необходимости проведения тех или иных медицинских мероприятий. Например, у 5% бактериовыделителей патологические изменения на рентгенограммах органов грудной клетки вообще не были обнаружены. У 17% — рентгенологи заподозрили наличие каких-то патологических изменений нетуберкулезной природы, а у 24% — специалисты не сочли необходимым проводить какие-либо медицинские мероприятия в отношении туберкулезного процесса. Если бы лечение назначали лишь тем больным, у которых не менее 50% специалистов обнаружили каверны, специфическую терапию получала бы только треть бактериовыделителей. С другой стороны, среди тех пациентов, у которых более 50% рентгенологов и пульмонологов обнаружили патологические изменения и высказали мнение о необходимости проведения лечения, было в 4 или 5 раз больше пациентов без бактериовыделения по данным бактериоскопии мазков мокроты. Такая же частота расхождений наблюдается в больницах, где диагноз туберкулеза обосновывают только рентгенологическими данными [ 16].
Сопутствующая патология, прежде всего ВИЧ-инфекция, существенно изменяет рентгенологические проявления туберкулеза легких и затрудняет его диагностику. Описанные выше вариации в трактовке рентгенограмм грудной клетки выражаются как значительными расхождениями между отдельными специалистами, так и несовпадениями при повторном изучении снимков теми же рентгенологами. Это положение было документировано самыми опытными экспертами в области рентгенологии и пульмонологии еще за много десятилетий до распространения ВИЧ-инфекции. Клинические исследования, проведенные в период бурного нарастания частоты сочетания туберкулеза и СПИДа, убедительно доказали атипичность рентгенологической картины туберкулеза у больных с данной сочетанной патологией. Характерными изменениями при ней являются увеличение прикорневых и медиастинальных лимфатических узлов, поражение средних и нижних отделов легких, а также отсутствие типичных для туберкулеза инфильтратов с распадом . Изменения на рентгенограммах у таких больных могут быть минимальными или вообще не определяться [ 18].
Две гипотетические стратегии по диагностике туберкулеза у больных с соче-танной патологией были исследованы в Малави, где ВИЧ-инфекция была обнаружена у 75% всех больных туберкулезом [ 19]. Согласно одной из стратегий у402 взрослых больных первым диагностическим мероприятием была рентгенография грудной клетки. Исследование мазков мокроты проводили в последующем, и только у больных с изменениями на рентгенограммах, подозрительными на туберкулез. Рентгенологическая картина у 172 больных, обследованных по этой стратегии, была расценена как нетуберкулезная. Между тем микобактерии туберкулеза методом бактериоскопии мазков мокроты были затем обнаружены у 13 (8%) из них, а всеми методами — бактериоскопией и/или посевом — у 53 (31%). Все эти больные могли бы быть пропущены при использовании данной стратегии скрининга туберкулеза. В то же время бактериовыделение с мокротой как при бактериоскопии, так и при посеве отсутствовало у 27% из 230 больных, которым назначалась противотуберкулезная химиотерапия по поводу рентгенологически заподозренного туберкулеза легких.
Вторая стратегия предусматривала первоочередное исследование мазков мокроты. Рентгенография легких проводилась в последующем, и только больным с отрицательными результатами бактериоскопии. Снимки грудной клетки, произведенные у 291 пациента, в 159 (55%) не выявили характерных для туберкулеза изменений, что стало основанием для исключения этого диагноза. Однако микобактерии туберкулеза затем были обнаружены при посевах мокроты у 40 (25%) этих больных. Таким образом, вторая из примененных стратегий диагностики привела бы к уменьшению числа пациентов, но ни один больной с положительными результатами бактериоскопии мазков мокроты не был бы пропущен. Однако рентгенография грудной клетки оказалась недостаточно чувствительной и в качестве второго шага при диагностике туберкулеза у больных с отрицательными результатами бактериоскопии. Это иллюстрировал тот факт, что у 47% из 132 больных с заподозренным на основании рентгенографии туберкулезом микобактерии не были обнаружены в последующем ни при бактериоскопии, ни при посеве.
Таким образом, суммарный опыт многих десятилетий сбора и детального анализа показал, что рентгенография грудной клетки не является достаточно надежным методом диагностики туберкулеза и наблюдения за его течением как у больных с сочетанной ВИЧ-инфекцией, так и без нее.
Оставить отзыв
Для отправки комментария вам необходимо авторизоваться.