Die Ösophagogastroduodenoskopie (ÖGD) ist eine millionenfach in Deutschland abgerechnete diagnostische Leistung. Eine der häufigsten Indikationen ist die symptomatische chronische Refluxkrankheit (GERD), wobei besonders die frühe Erkennung eines metaplastischen Barrett-Ösophagus mit entsprechend erhöhtem Krebsrisiko im Fokus steht.
Eine italienische systematische Übersichtsarbeit mit Metaanalyse versuchte jetzt zu klären, ob Methoden der Künstlichen Intelligenz (KI) bei der endoskopischen Diagnostik von malignen und gutartigen Speiseröhrenerkrankungen hilfreich sind. Die für eine Metaanalyse letztlich geeigneten 19 Studien identifizierten die Forscher mittels gängiger Fachliteratur-Datenbanken (Medline, Embase, Embase Classic, Cochrane Library). Zur Berechnung der gepoolten diagnostischen Effektivität von KI-Modellen resp. Endoskopikern wurde ein bivariates Random-Effect-Modell verwendet. Die Bildgebungsreferenzen bestanden aus den histologischen Ergebnissen hinsichtlich Neoplasien bzw. der klinischen und instrumentellen Diagnose einer gastroösophagealen Refluxkrankheit. Zielgrößen der Bewertung waren die gepoolte Fläche unter der Grenzwertoptimierungskurve (AUROC), die Sensitivität, die Spezifität, der positive und negative Likelihood-Quotient (LR+, LR-) und das diagnostische Chancenverhältnis (DOR).
Es zeigte sich, dass der Einsatz Künstlicher Intelligenz bei der Diagnose einer Barrett-Neoplasie eine AUROC von 0,90, eine Sensitivität von 0,89, eine Spezifität von 0,86, LR+ 6,50, LR- 0,13 und DOR 50,53 hatte. Damit, so fassen die Wissenschaftler zusammen, war die diagnostische Leistung der KI-Modelle vergleichbar mit der von Endoskopikern (p=0,35). Für die Diagnose eines ösophagealen Plattenepithelkarzinoms betrugen AUROC, Sensitivität, Spezifität, LR+, LR- und DOR 0,97, 0,95, 0,92, 12,65, 0,05 bzw. DOR 258,36. Bei dieser Aufgabe schnitt die KI besser als Endoskopiker ab, wenn auch ohne statistisch signifikante Unterschiede. Auch beim endoskopisch herausfordernden Nachweis abnormaler intrapapillärer Kapillarschleifen konnten die KI-Algorithmen überzeugen, genau wie bei der schlüssigen Interpretation von GERD-Fragebögen (wobei diese idealerweise nur so wenig Items haben, dass KI überflüssig erscheint). Die Autoren kommen zu dem Schluss, dass Künstliche Intelligenz sehr effektiv die endoskopische, aber auch klinische Diagnostik von Speiseröhrenerkrankungen unterstützt und ‒ so ihre Vorstellung ‒ eine bedeutende Rolle für die optimierte Früherkennung durch Untersucher mit geringerer Endoskopie-Expertise spielen könnte.
Visaggi P et al., Aliment Pharmacol Ther 2022 Jan 30; DOI 10.1111/apt.16778, PMID 35098562