Eine Gruppe von Inselspital-Medizinern erarbeitete die weltweit erste Studie, die der Wirkung eines KI-basierten Diagnosesystems in der Akutmedizin nachging. Die Untersuchung unter der Leitung von Wolf Hautz von der Berner Universitätsklinik für Notfallmedizin erfasste 1’200 Patientinnen und Patienten, die 2022 und 2023 mit unspezifischen Beschwerden in vier Schweizer Notaufnahmen behandelt worden waren. Die untersuchenden Ärzte sahen sich dabei etwa mit Ohnmacht, Bauchschmerzen oder Fieber unbekannter Ursache konfrontiert.
- Wolf E. Hautz, Thimo Marcin, Stefanie C. Hautz, Stefan K. Schauber, Gert Krummrey, Martin Müller et al.: «Diagnoses supported by a computerised diagnostic decision support system versus conventional diagnoses in emergency patients (DDX-BRO): a multicentre, multiple-period, double-blind, cluster-randomised, crossover superiority trial», in: «The Lancet Digital Health», Februar 2025.
- doi: 10.1016/S2589-7500(24)00250-4
Dabei nutzten sie teilweise das KI-basierte System
«Isabel Pro», das sie bei der Diagnosestellung unterstützte. In den Kontrollphasen wurden hingegen Diagnosen ohne technische Hilfsmittel gestellt.
Die Qualität der Diagnose wurde daran gemessen, ob die Patienten innerhalb von 14 Tagen nach der Behandlung ungeplante medizinische Nachsorge benötigten, ob Diagnosen im Nachhinein geändert wurden, ob eine unerwartete Intensivaufnahme erforderlich war oder ob es zu Todesfällen kam.
Siehe da: In den beiden Gruppen respektive Phasen unterschieden sich die Ergebnisse kaum.
Sowohl mit als auch ohne KI-basierte Diagnoseunterstützung trat bei 18 Prozent der Patienten ein diagnostischer Mangel auf. Auch bei anderen Qualitätskriterien konnte das Berner Team keine Unterschiede feststellen – also weder bezüglich schweren unerwünschten Ereignissen noch beim Ressourcenverbrauch, gemessen in Schweizer Franken.
«KI-basierte Diagnoseunterstützung hat in der Notfallmedizin keinen für die Patientinnen und Patienten messbaren Effekt. Unabhängig davon, ob man nach medizinischen, ökonomischen oder prozeduralen Unterschieden schaut», kommentiert Wolf Hautz die Ergebnisse.
Zumindest die derzeit verfügbare KI werde das Problem der Fehldiagnosen nicht lösen: «Wir müssen andere Lösungsansätze verfolgen, um die Diagnosequalität zu verbessern, und insbesondere die Forschung zu diesem Thema, die aktuell in den Kinderschuhen steckt, erheblich intensivieren.»