Arzneimittelberatung: ChatGPT scheitert an komplexen Fragen

Die Medizinische Hochschule Hannover hat untersucht, wie gut ChatGPT bei Pharmakotherapiefragen berät. Das Ergebnis: Der Chatbot machte doppelt so viele Fehler wie Ärzte.

, 10. November 2025 um 05:41
image
KI kann (noch) nicht mitreden, wenn es um pharmakotherapeutische Fragen geht. KI-Symbolbild: Docinside mit ChatGPT.
Während KI-Systeme in der Radiologie oder der Dermatologie teils mit Fachleuten mithalten, zeigt sich in der Pharmakotherapieberatung ein anderes Bild.
Forschende der Medizinischen Hochschule Hannover (MHH) haben im «British Journal of Clinical Pharmacology» untersucht, wie gut ChatGPT auf reale pharmakologische Anfragen reagiert. Dabei müssen patientenspezifische Faktoren wie Alter, Komorbiditäten oder Nieren- und Leberfunktion analysiert und sprachlich präzise Therapievorschläge formuliert werden.
Das Ergebnis ist eindeutig: Die menschliche Expertise schnitt deutlich besser ab – sowohl inhaltlich als auch in der Informationsqualität.

Menschliche Expertise bleibt unverzichtbar

Das Team stellte ChatGPT (3.5) 70 praxisnahe pharmakotherapeutische Anfragen. Die Antworten des Chatbot verglichen die Forschenden mit jenen, die Ärztinnen und Ärzte im Arzneimittelinformationszentrum der MHH zwischen Juni und Oktober 2023 erstellt hatten.
Drei unabhängige, verblindete Gutachter mit unterschiedlicher Berufserfahrung – vom Berufsanfänger bis zum Facharzt für Klinische Pharmakologie – bewerteten die Informationsqualität, inhaltliche Richtigkeit und sprachliche Qualität der Antworten.

Das Ergebnis:
  • Medianwert für die Informationsqualität: 5 («sehr gut») bei ärztlichen Antworten, 2 («schwach») bei ChatGPT
  • Faktisch falsche Angaben: 5,7–17,1 Prozent bei den Ärztinnen und Ärzten, 32,9–55,7 Prozent bei ChatGPT
«Unsere Ergebnisse legen nahe, dass Fachleute der KI hier nach wie vor überlegen sind», sagt Erstautor Benjamin Krichevsky im «Deutschen Ärzteblatt».
Einige Fehler waren besonders gravierend: ChatGPT beschrieb beispielsweise Actrapid (Humaninsulin) als Analgetikum oder empfahl, den INR-Wert (International Normalized Ratio) zur Überwachung direkter oraler Antikoagulanzien zu verwenden.
«Hätten medizinische Fachkräfte solche Ratschläge unkritisch übernommen, hätte dies potenziell gefährliche Folgen haben können – von einer unzureichenden Schmerztherapie bis hin zu einem erhöhten Risiko für Hypoglykämien, Blutungen oder thromboembolische Komplikationen», erläutert Letztautor Heck gegenüber dem «Deutschen Ärzteblatt».
«Our study suggests that to date it must be strongly cautioned against the use of ChatGPT in pharmacotherapy counselling.» Krichevsky et al. (2025)
Zugleich weisen die Autorinnen und Autoren darauf hin, dass nur eine ältere Modellversion (3.5) getestet wurde. Ob neuere Systeme wie GPT-5 oder spezialisierte KI-Modelle künftig bessere Ergebnisse liefern, müsse in weiteren Studien überprüft werden.
Fazit für die Praxis
Die Studie zeigt exemplarisch, dass klinische Pharmakologie mehr erfordert als Textverständnis – sie verlangt Erfahrung, Kontextwissen und Verantwortungsbewusstsein. KI kann bei der Informationssuche unterstützen, ersetzt aber keine ärztliche Entscheidung.

Zur Originalpublikation:

    Artikel teilen

    Loading

    Kommentar

    Mehr zum Thema

    image

    Shoppen mit Sprechstunde: Supermarkt bietet Telemedizin

    In Deutschland startet der Detailhändler Kaufland ein Pilotprojekt: Im Kassenbereich eines Supermarkts steht nun ein Telemedizin-Raum. So soll der Arztbesuch alltagstauglicher werden.

    image

    Heimatschutz bremst KSB-Rückbau – Petition fordert Rückzug der Beschwerde

    Der Aargauer Heimatschutz sorgt für Kopfschütteln: Er will den asbestbelasteten Plattenbau des Kantonsspitals Baden aus den 1970er-Jahren unter Denkmalschutz stellen.

    image

    US-Pilotprojekt sorgt für Druck auf Schweizer Medikamentenpreise

    Mit dem Generous-Modell sollen US-Preise für Medicaid an internationale Vergleichspreise gekoppelt werden – die Schweiz spielt dabei eine zentrale Rolle. Der Verband Interpharma fordert dringend Reformen.

    image

    Vom Zimmermann zum Marketing: Saschas Weg bei ZURZACH Care

    Vom Zimmermann über die Therapie und weiter ins Marketing – Sascha durchlief eine vielseitige Laufbahn bei ZURZACH Care.

    image

    ANQ-Report: Chirurgische Infektionen bleiben stabil

    Die niedrigsten Infektionsraten weisen Kniegelenkersatz-Operationen auf, die höchsten Dickdarm- und Rektumoperationen. Das zeigen aktuelle Ergebnisse des Qualitätszentrums ANQ.

    image

    BFS: Zahl privater Spitex-Anbieter erreicht Rekordwert

    Die Zahl privater Spitex-Anbieter erreichte 2024 einen neuen Höchststand: 844 gewinnorientierte Unternehmen leisten immer mehr Pflegestunden, während gemeinnützige Organisationen Marktanteile verlieren.

    Vom gleichen Autor

    image

    Globale Ungleichheiten bei der Behandlung von Frauen mit Krebs

    Reiches Land, bessere Überlebenschance: Laut einer Lancet-Studie entscheidet das Einkommen eines Landes über den Zeitpunkt der Krebsdiagnose und die Qualität der Behandlung.

    image

    Schon 5’000 Schritte täglich könnten Alzheimer verlangsamen

    Mehr Bewegung kann laut einer Studie den geistigen Abbau bremsen: Daten der Harvard Aging Brain Study zeigen, dass sich bei Menschen mit ersten Alzheimer-Anzeichen weniger Tau-Ablagerungen bilden.

    image

    Abnehmspritzen wirken – aber unabhängige Daten fehlen

    Die Datenlage bei Abnehmspritzen ist einseitig: Fast alle Studien stammen von den Herstellern selbst. Forschende warnen vor Interessenkonflikten – und fordern unabhängige Langzeitstudien.