Sie hilft bei der Beurteilung von Röntgen- und MRT-Bildern, beim Schreiben von Arztbriefen oder bei der Auswertung von Messdaten in der Forschung – die sog. Künstliche Intelligenz (KI) ist in der klinischen Praxis und in der biomedizinischen Forschung zu einem hilfreichen Instrument geworden. Nun haben Hochschulen und Forschungsorganisationen Empfehlungen und Leitlinien zu ihrer Nutzung in der Wissenschaft formuliert.
Wie berechtigt das ist, untermauert das Experiment einer Arbeitsgruppe am Universitätsklinikum Jena (UKJ): Das Forschungsteam nutzte den öffentlich verfügbaren Deep-Learning-Algorithmus „Stable Diffusion“ (de.wikipedia.org/wiki/Stable_Diffusion), um aus Trainingsdaten neue histologische Bilder zu erstellen. „Wir verwendeten als Trainingsbilder einmal drei und einmal 15 echte Schnittbilder von angefärbtem Gewebe aus Mäusenieren“, so Studienleiter Prof. Dr. med. Ralf Mrowka. „Bereits auf der Basis von drei Originalbildern entstanden schon recht überzeugende Bilder.“
In einer Online-Umfrage testete das Forschungsteam, ob diese KI-generierten Histologiebilder von echten zu unterscheiden waren. Die über 800 Teilnehmenden der Umfrage wurden dafür in Experten oder Laien eingeteilt, je nachdem, ob sie Erfahrungen mit dem Beurteilen von histologischen Bildern hatten, wie etwa Medizinstudierende, oder nicht. Ihnen wurden nacheinander 16 einzelne Bilder – je acht echte und KI-generierte – gezeigt, jedes Bild sollte klassifiziert werden, bevor das nächste erschien.
Neue Methoden zur Erkennung gefälschter Daten notwendig
Die Expertengruppe ordnete gut zwei Drittel richtig ein. Der Laiengruppe gelang dies nur in etwa der Hälfte der Fälle. Beide Gruppen konnten die auf wenigen Trainingsdaten beruhenden KI-Bilder häufiger enttarnen. Zehn Teilnehmende der Expertengruppe erkannten alle Bilder korrekt. Über alle Bilder- und Teilnehmergruppen hinweg fielen die Entscheidungen zumeist innerhalb der ersten halben Minute. „Wir konnten auch feststellen, dass richtige Zuordnungen signifikant schneller getroffen wurden als falsche,“ stellt Erstautor Dr. med. Jan Hartung heraus. „Eine Beobachtung, die mit gängigen Modellen der wahrnehmungsbasierten Entscheidungsfindung im Einklang steht“.
„Unser Experiment zeigt, dass die Erfahrung hilft, gefälschte Bilder zu erkennen; dass aber auch dann ein nicht geringer Anteil künstlicher Bilder nicht zuverlässig identifiziert wird“, sagt Mrowka. „Dabei sind die technischen Hürden für jemanden mit der Absicht, Abbildungen zu fälschen, relativ gering“, wie Hartung betont. „Man braucht nicht Hunderte von Beispielen zum Trainieren eines Algorithmus, ein Dutzend kann bereits ausreichend sein.“ Das Autorenteam sieht darin eine Herausforderung für die Wissenschaft, derer diese sich bewusst sein muss und die neuer Methoden zur Erkennung gefälschter Daten in wissenschaftlichen Arbeiten bedarf.
Pressemitteilung „Täuschend echt: KI-generierte Histologiebilder“. Friedrich-Schiller-Universität Jena, 16.12.2024 (https://www.uni-jena.de/292270/taeuschend-echt-ki-generierte-histologiebilder).
* Hartung J et al.: Experts fail to reliably detect AI-generated histological data. Sci Rep. 2024 Nov 19;14(1):28677 (DOI 10.1038/s41598-024-73913-8).