Pädiatrie: ChatGPT diagnostiziert miserabel

KI-Diagnosehilfen sorgen regelmässig für positive Überraschungen. Doch sind die Patienten Kinder, dann wird es offenbar schwierig.

, 8. Januar 2024 um 23:43
letzte Aktualisierung: 1. September 2024 um 14:51
image
Klappt kaum: Roboter als Pädiater  |  Symbolbild: Medinside, erstellt mit KI Midjourney.
Wie präzise die medizinischen Diagnosen von KI- beziehungsweise Large-Language-Model-Systemen sind – dies wurde bekanntlich schon mehrfach analysiert.
Ein Team des Cohen Children's Medical Center in New York ging nun einem Spezialfall nach: nämlich den Kinderkrankheiten. Respektive der Präzision solcher KI-Hilfsdiagnosen in der Pädiatrie.
Das Ergebnis war enttäuschend. Konkret gaben die Autoren um den Pädiater Joseph Barile 100 Symptomschilderungen als Prompts bei ChatGPT (Version 3.5) ein. Resultat: In 83 von 100 Fällen war die Diagnose des Systems inkorrekt.
Mehrheitlich waren die Vorschläge schlicht falsch (72 Fälle), und bei elf Antworten wies ChatGPT zwar auf den richtigen Befund hin, aber die Aussage war zu allgemein gehalten, als dass sie wirklich gestimmt hätte.
  • Joseph Barile, Alex Margolis, Grace Cason et al.: «Diagnostic Accuracy of a Large Language Model in Pediatric Case Studies», in: JAMA Pediatrics, Januar 2024.
  • doi:10.1001/jamapediatrics.2023.5750
Bemerkenswert ist dies, weil das Ergebnis auf spezielle Probleme in der Pädiatrie hinweist. Denn eine ähnlich angelegte Studie von Forschern aus Boston hatte im Juni 2023 ergeben, dass ChatGPT immerhin in 39 Prozent der Fälle dieselbe Diagnose stellte wie ein Expertenteam (im Rahmen der «New England Journal of Medicine» Case Challenges, wo jeweils komplexe Fälle analysiert werden). Hier waren die Ergebnisse also spürbar besser gewesen.
Die Autoren des New Yorker Teams erklären nun das deutlich schlechtere Abschneiden bei den pädiatrischen Tests damit, dass das Alter in diesem Feld meist wichtig ist für die präzise Diagnose – und dass die kleinen Patienten ihre Beschwerden oft unklar beschreiben.

Purpura statt Skorbut

Für die Studien nahmen die Autoren Fälle aus Kinderarzt-Praxen, die in «JAMA Pediatrics» in den vergangenen zehn Jahren diskutiert worden waren, und gaben die Symptome und Beschreibungen bei ChatGPT ein.
Dass weniger als ein Fünftel der Eingaben zu einer korrekten Diagnose führten, lässt ahnen, dass solche KI-Helfer bestenfalls als Ideenstütze dienen können.
Oder positiv formuliert: In 57 Prozent der Fälle schaffte es ChatGPT immerhin, die Krankheit bei den richtigen Organen zu verorten.
Beispielsweise diagnostizierte die KI bei einer einer nässenden Papel am Hals eines Säuglings eine Astspaltzyste – die Diagnose des Arztes lautete Branchio-oto-renales Syndrom.
Oder bei einem autistischen Teenager mit Hautausschlag und Arthralgien tippte ChatGPT auf immunthrombozytopenische Purpura; die Diagnose des Arztes lautete: Skorbut.

  • künstliche intelligenz
  • Forschung
  • Pädiatrie
Artikel teilen

Loading

Comment

2 x pro Woche
Abonnieren Sie unseren Newsletter.

oder

Mehr zum Thema

image
Der KI-Ticker

Wo Künstliche Intelligenz das Gesundheitswesen verändert

Chatbox für Patientenfragen ++ Leitfaden: KI in Medizin und Pflege ++ Modell erahnt Parkinson-Risiko ++ KI in der Krebserkennung ++ KI kann aus Sprechweise Demenz ableiten ++

image

Wie erkennt man das Herzinfarkt-Risiko? Mit einem Fragebogen.

Ein Schnelltest für den Heimgebrauch könnte bald helfen, kardiovaskuläre Risiken zu erkennen.

image

Die Leute glauben Dr. Google. Aber Dr. KI trauen Sie nicht über den Weg.

Greifen Ärzte auf Künstliche Intelligenz zurück, so stösst dies bei den Patienten auf Widerstand.

image

Studie: KI-Chatbots wären miserable Ärzte

Sie stellen vorschnelle Diagnosen, scheren sich nicht um Richtlinien und verlangen riskante Untersuchungen.

image

«Wahrscheinlich krebserregend»: Die WHO warnt vor Talk

Das vielfach verwendete Pulver ist nun auf der zweithöchsten Gewissheits-Stufe, dass ein Stoff Krebs verursacht.

image

Anderer Patient, andere Infektion

Das Alter, der BMI und die Dauer der Operation beeinflussen die Zusammensetzung der Bakterien bei chirurgischen Wundinfektionen. Dies fanden Berner Mediziner heraus.

Vom gleichen Autor

image

Sagen Sie es uns: Welches Spital soll geschlossen werden?

Regelmässig hört man, die Schweiz solle auf Spitäler verzichten. Also gut: Werden wir konkret. Welche Häuser sollen weg? Medinside sucht die Namen.

image

Kantonsspital Glarus: Neue Leitung für die Frauenklinik

Ioannis Dedes wechselt als Chefarzt vom Inselspital ans KSGL, Celia Waldthaler wird Leitende Ärztin.

image

In Konstanz kriegt man mehr aktuelle Arzneimittel als in Kreuzlingen

Geht es um den Zugang zu neuen, innovativen Medikamenten, so liegt die Schweiz auf Rang 6 in Europa. Bei den Medikamenten gegen seltene Krankheiten liegt sie auf Rang 9.