Pädiatrie: ChatGPT diagnostiziert miserabel

KI-Diagnosehilfen sorgen regelmässig für positive Überraschungen. Doch sind die Patienten Kinder, dann wird es offenbar schwierig.

, 8. Januar 2024 um 23:43
letzte Aktualisierung: 2. Dezember 2024 um 07:32
image
Klappt kaum: Roboter als Pädiater  |  Symbolbild: Medinside, erstellt mit KI Midjourney.
Wie präzise die medizinischen Diagnosen von KI- beziehungsweise Large-Language-Model-Systemen sind – dies wurde bekanntlich schon mehrfach analysiert.
Ein Team des Cohen Children's Medical Center in New York ging nun einem Spezialfall nach: nämlich den Kinderkrankheiten. Respektive der Präzision solcher KI-Hilfsdiagnosen in der Pädiatrie.
Das Ergebnis war enttäuschend. Konkret gaben die Autoren um den Pädiater Joseph Barile 100 Symptomschilderungen als Prompts bei ChatGPT (Version 3.5) ein. Resultat: In 83 von 100 Fällen war die Diagnose des Systems inkorrekt.
Mehrheitlich waren die Vorschläge schlicht falsch (72 Fälle), und bei elf Antworten wies ChatGPT zwar auf den richtigen Befund hin, aber die Aussage war zu allgemein gehalten, als dass sie wirklich gestimmt hätte.
  • Joseph Barile, Alex Margolis, Grace Cason et al.: «Diagnostic Accuracy of a Large Language Model in Pediatric Case Studies», in: JAMA Pediatrics, Januar 2024.
  • doi:10.1001/jamapediatrics.2023.5750
Bemerkenswert ist dies, weil das Ergebnis auf spezielle Probleme in der Pädiatrie hinweist. Denn eine ähnlich angelegte Studie von Forschern aus Boston hatte im Juni 2023 ergeben, dass ChatGPT immerhin in 39 Prozent der Fälle dieselbe Diagnose stellte wie ein Expertenteam (im Rahmen der «New England Journal of Medicine» Case Challenges, wo jeweils komplexe Fälle analysiert werden). Hier waren die Ergebnisse also spürbar besser gewesen.
Die Autoren des New Yorker Teams erklären nun das deutlich schlechtere Abschneiden bei den pädiatrischen Tests damit, dass das Alter in diesem Feld meist wichtig ist für die präzise Diagnose – und dass die kleinen Patienten ihre Beschwerden oft unklar beschreiben.

Purpura statt Skorbut

Für die Studien nahmen die Autoren Fälle aus Kinderarzt-Praxen, die in «JAMA Pediatrics» in den vergangenen zehn Jahren diskutiert worden waren, und gaben die Symptome und Beschreibungen bei ChatGPT ein.
Dass weniger als ein Fünftel der Eingaben zu einer korrekten Diagnose führten, lässt ahnen, dass solche KI-Helfer bestenfalls als Ideenstütze dienen können.
Oder positiv formuliert: In 57 Prozent der Fälle schaffte es ChatGPT immerhin, die Krankheit bei den richtigen Organen zu verorten.
Beispielsweise diagnostizierte die KI bei einer einer nässenden Papel am Hals eines Säuglings eine Astspaltzyste – die Diagnose des Arztes lautete Branchio-oto-renales Syndrom.
Oder bei einem autistischen Teenager mit Hautausschlag und Arthralgien tippte ChatGPT auf immunthrombozytopenische Purpura; die Diagnose des Arztes lautete: Skorbut.

  • künstliche intelligenz
  • Forschung
  • Pädiatrie
Artikel teilen

Loading

Kommentar

Mehr zum Thema

image

Vom Tippen zum Denken: medizinische Berichtserstellung neu gedacht

Der Moment, in dem alles Klick macht.

image

OKS: Sebastian Kerzel wird Mitglied der Spitalleitung

Der Experte für pädiatrische Pneumologie und Allergologie wechselt aus Regensburg nach St. Gallen und wird Chefarzt Kinder- und Jugendmedizin.

image

Gesichts-Bilder für den Gesundheits-Check

Die Wärmeverteilung auf Nase, Stirn, Augenpartie, Backen könnte ein brauchbarer Indikator für gesundheitliche Probleme sein.

image

ChatGPT beantwortet Patientenfragen genauso gut wie Augenärzte

Die Ophthalmologie könnte zu den Fachgebieten gehören, die durch Künstliche Intelligenz besonders viel neuen Schub bekommen.

image

Innovative Kinderradiologie am Kantonsspital Baden

Das Kantonsspital Baden setzt in seinem Neubau neue Massstäbe in der patientenfreundlichen Versorgung von Kindern und Jugendlichen. Die Kinderradiologie bietet ein breites Spektrum an diagnostischen und therapeutischen Leistungen und arbeitet eng mit anderen Fachbereichen zusammen.

image

KI auf Abwegen: Wenn das Röntgenbild sagt, dass einer Bier trinkt

Künstliche Intelligenz birgt in der Medizin ein heikles Risiko: das «Shortcut Learning». Dabei liefern Algorithmen völlig akkurate Ergebnisse – die kreuzfalsch sind.

Vom gleichen Autor

image

Landesspital Liechtenstein: Christian Reize wird Interims-CEO

Die Stelle für die definitive Nachfolge der Spitaldirektion ist weiterhin ausgeschrieben.

image

Uri: 47 Prozent mehr Geld vom Kanton

Das Kantonsspital Uri soll deutlich höhere Beiträge für gemeinwirtschaftliche Leistungen erhalten. Im Grunde gleicht der Kanton so auch steigende Kosten im Gesundheitswesen aus.

image

Spitalplanung: Prio.Swiss geht vor Gericht

Das Bundesverwaltungsgericht soll eingreifen und die Akutspital-Planung von Schwyz zurückweisen. Die Versicherer machen den Kanton zum Musterfall.