Pädiatrie: ChatGPT diagnostiziert miserabel

Ein Versuch, mit dem KI-System Kinderkrankheiten zu erkennen, endete ernüchternd.

, 8. Januar 2024 um 23:43
letzte Aktualisierung: 27. Mai 2024 um 08:23

Klappt kaum: Roboter als Pädiater | Symbolbild: Medinside, erstellt mit KI Midjourney.

Wie präzise die medizinischen Diagnosen von KI- beziehungsweise Large-Language-Model-Systemen sind – dies wurde bekanntlich schon mehrfach analysiert.

Ein Team des Cohen Children's Medical Center in New York ging nun einem Spezialfall nach: nämlich den Kinderkrankheiten. Respektive der Präzision solcher KI-Hilfsdiagnosen in der Pädiatrie.

Das Ergebnis war enttäuschend. Konkret gaben die Autoren um den Pädiater Joseph Barile 100 Symptomschilderungen als Prompts bei ChatGPT (Version 3.5) ein. Resultat: In 83 von 100 Fällen war die Diagnose des Systems inkorrekt.

Mehrheitlich waren die Vorschläge schlicht falsch (72 Fälle), und bei elf Antworten wies ChatGPT zwar auf den richtigen Befund hin, aber die Aussage war zu allgemein gehalten, als dass sie wirklich gestimmt hätte.

Joseph Barile, Alex Margolis, Grace Cason et al.: «Diagnostic Accuracy of a Large Language Model in Pediatric Case Studies», in: JAMA Pediatrics, Januar 2024.
doi:10.1001/jamapediatrics.2023.5750

Bemerkenswert ist dies, weil das Ergebnis auf spezielle Probleme in der Pädiatrie hinweist. Denn eine ähnlich angelegte Studie von Forschern aus Boston hatte im Juni 2023 ergeben, dass ChatGPT immerhin in 39 Prozent der Fälle dieselbe Diagnose stellte wie ein Expertenteam (im Rahmen der «New England Journal of Medicine» Case Challenges, wo jeweils komplexe Fälle analysiert werden). Hier waren die Ergebnisse also spürbar besser gewesen.

Die Autoren des New Yorker Teams erklären nun das deutlich schlechtere Abschneiden bei den pädiatrischen Tests damit, dass das Alter in diesem Feld meist wichtig ist für die präzise Diagnose – und dass die kleinen Patienten ihre Beschwerden oft unklar beschreiben.

Purpura statt Skorbut

Für die Studien nahmen die Autoren Fälle aus Kinderarzt-Praxen, die in «JAMA Pediatrics» in den vergangenen zehn Jahren diskutiert worden waren, und gaben die Symptome und Beschreibungen bei ChatGPT ein.

Dass weniger als ein Fünftel der Eingaben zu einer korrekten Diagnose führten, lässt ahnen, dass solche KI-Helfer bestenfalls als Ideenstütze dienen können.

Oder positiv formuliert: In 57 Prozent der Fälle schaffte es ChatGPT immerhin, die Krankheit bei den richtigen Organen zu verorten.

Beispielsweise diagnostizierte die KI bei einer einer nässenden Papel am Hals eines Säuglings eine Astspaltzyste – die Diagnose des Arztes lautete Branchio-oto-renales Syndrom.

Oder bei einem autistischen Teenager mit Hautausschlag und Arthralgien tippte ChatGPT auf immunthrombozytopenische Purpura; die Diagnose des Arztes lautete: Skorbut.

Hattip: «Medpage Today».

Artikel teilen

Comment

2 x pro Woche
Abonnieren Sie unseren Newsletter.

Mehr zum Thema

Sitem-Insel soll in diesem Jahr selbsttragend werden

Das Berner Medizin-Innovationszentrum konnte zuletzt deutlich mehr Drittmittel einwerben und Patente anmelden.

Kinderspital Zentralschweiz: Datenanalyse soll Behandlungen verbessern

Das Center for Child Health Analytics des KidZ erhält Unterstützung von der Stiftung Zukunft Kinderspital Zentralschweiz.

Milliardenspende für die Immunologie in Basel

Die Botnar-Stiftung errichtet mit der University of Oxford und der ETH ein neues Forschungsinstitut.

Kommentar von Marc-André Giger

Tardoc: Auch die Kinderspitäler können nicht mehr warten

In der Kindermedizin wird besonders deutlich, weshalb das heutige Tarifsystem unhaltbar geworden ist.

Forschung muss Frauen und Alte mehr berücksichtigen

Der Bund regelt die Forschung an Menschen stärker. Künftig sollen mehr Frauen und Alte teilnehmen.

Das sind die SGAIM-Preisträger

Die Schweizerischen Gesellschaft für Allgemeine Innere Medizin hat fünf Projekte mit Fokus «Sonografie» ausgezeichnet.

Vom gleichen Autor

Studie: Unser Gesundheitswesen ist eine CO2-Schleuder

Der Gesundheitssektor verursacht fast 7 Prozent der Schweizer Treibhausgas-Emissionen. Im internationalen Vergleich steht die hiesige Branche nicht allzu sauber da.

Psychiatrie-Zentrum Engadin / Südbünden zieht ins Spital Samedan

Die heutigen PDGR-Standorte in Samedan und St. Moritz werden aufgelöst.

Gesucht: 14'700 Profis für das Gesundheitswesen

In der Schweiz waren in den letzten Monaten etwas weniger Stellen offen als zu Jahresbeginn – sogar im Gesundheitsbereich. Ausnahme: die Ärzte.