Arzneimittelberatung: ChatGPT scheitert an komplexen Fragen

Die Medizinische Hochschule Hannover hat untersucht, wie gut ChatGPT bei Pharmakotherapiefragen berät. Das Ergebnis: Der Chatbot machte doppelt so viele Fehler wie Ärzte.

, 10. November 2025 um 05:41

KI kann (noch) nicht mitreden, wenn es um pharmakotherapeutische Fragen geht. KI-Symbolbild: Docinside mit ChatGPT.

Während KI-Systeme in der Radiologie oder der Dermatologie teils mit Fachleuten mithalten, zeigt sich in der Pharmakotherapieberatung ein anderes Bild.

Forschende der Medizinischen Hochschule Hannover (MHH) haben im «British Journal of Clinical Pharmacology» untersucht, wie gut ChatGPT auf reale pharmakologische Anfragen reagiert. Dabei müssen patientenspezifische Faktoren wie Alter, Komorbiditäten oder Nieren- und Leberfunktion analysiert und sprachlich präzise Therapievorschläge formuliert werden.

Das Ergebnis ist eindeutig: Die menschliche Expertise schnitt deutlich besser ab – sowohl inhaltlich als auch in der Informationsqualität.

Menschliche Expertise bleibt unverzichtbar

Das Team stellte ChatGPT (3.5) 70 praxisnahe pharmakotherapeutische Anfragen. Die Antworten des Chatbot verglichen die Forschenden mit jenen, die Ärztinnen und Ärzte im Arzneimittelinformationszentrum der MHH zwischen Juni und Oktober 2023 erstellt hatten.

Drei unabhängige, verblindete Gutachter mit unterschiedlicher Berufserfahrung – vom Berufsanfänger bis zum Facharzt für Klinische Pharmakologie – bewerteten die Informationsqualität, inhaltliche Richtigkeit und sprachliche Qualität der Antworten.

Das Ergebnis:

Medianwert für die Informationsqualität: 5 («sehr gut») bei ärztlichen Antworten, 2 («schwach») bei ChatGPT
Faktisch falsche Angaben: 5,7–17,1 Prozent bei den Ärztinnen und Ärzten, 32,9–55,7 Prozent bei ChatGPT

«Unsere Ergebnisse legen nahe, dass Fachleute der KI hier nach wie vor überlegen sind», sagt Erstautor Benjamin Krichevsky im «Deutschen Ärzteblatt».

Einige Fehler waren besonders gravierend: ChatGPT beschrieb beispielsweise Actrapid (Humaninsulin) als Analgetikum oder empfahl, den INR-Wert (International Normalized Ratio) zur Überwachung direkter oraler Antikoagulanzien zu verwenden.

«Hätten medizinische Fachkräfte solche Ratschläge unkritisch übernommen, hätte dies potenziell gefährliche Folgen haben können – von einer unzureichenden Schmerztherapie bis hin zu einem erhöhten Risiko für Hypoglykämien, Blutungen oder thromboembolische Komplikationen», erläutert Letztautor Heck gegenüber dem «Deutschen Ärzteblatt».

«Our study suggests that to date it must be strongly cautioned against the use of ChatGPT in pharmacotherapy counselling.» Krichevsky et al. (2025)

Zugleich weisen die Autorinnen und Autoren darauf hin, dass nur eine ältere Modellversion (3.5) getestet wurde. Ob neuere Systeme wie GPT-5 oder spezialisierte KI-Modelle künftig bessere Ergebnisse liefern, müsse in weiteren Studien überprüft werden.

Fazit für die Praxis

Die Studie zeigt exemplarisch, dass klinische Pharmakologie mehr erfordert als Textverständnis – sie verlangt Erfahrung, Kontextwissen und Verantwortungsbewusstsein. KI kann bei der Informationssuche unterstützen, ersetzt aber keine ärztliche Entscheidung.

Zur Originalpublikation:

Benjamin Krichevsky, Stefan Engeli, Stefanie M. Bode-Böger, et al.: «Human vs. artificial intelligence: Physicians outperform ChatGPT in real-world pharmacotherapy counselling», in: «British Journal of Clinical Pharmacology», Oktober 2025.
DOI: 10.1002/bcp.70321

Artikel teilen

Kommentar

Mehr zum Thema

Shoppen mit Sprechstunde: Supermarkt bietet Telemedizin

In Deutschland startet der Detailhändler Kaufland ein Pilotprojekt: Im Kassenbereich eines Supermarkts steht nun ein Telemedizin-Raum. So soll der Arztbesuch alltagstauglicher werden.

Heimatschutz bremst KSB-Rückbau – Petition fordert Rückzug der Beschwerde

Der Aargauer Heimatschutz sorgt für Kopfschütteln: Er will den asbestbelasteten Plattenbau des Kantonsspitals Baden aus den 1970er-Jahren unter Denkmalschutz stellen.

US-Pilotprojekt sorgt für Druck auf Schweizer Medikamentenpreise

Mit dem Generous-Modell sollen US-Preise für Medicaid an internationale Vergleichspreise gekoppelt werden – die Schweiz spielt dabei eine zentrale Rolle. Der Verband Interpharma fordert dringend Reformen.

Vom Zimmermann zum Marketing: Saschas Weg bei ZURZACH Care

Vom Zimmermann über die Therapie und weiter ins Marketing – Sascha durchlief eine vielseitige Laufbahn bei ZURZACH Care.

ANQ-Report: Chirurgische Infektionen bleiben stabil

Die niedrigsten Infektionsraten weisen Kniegelenkersatz-Operationen auf, die höchsten Dickdarm- und Rektumoperationen. Das zeigen aktuelle Ergebnisse des Qualitätszentrums ANQ.

BFS: Zahl privater Spitex-Anbieter erreicht Rekordwert

Die Zahl privater Spitex-Anbieter erreichte 2024 einen neuen Höchststand: 844 gewinnorientierte Unternehmen leisten immer mehr Pflegestunden, während gemeinnützige Organisationen Marktanteile verlieren.

Vom gleichen Autor

Globale Ungleichheiten bei der Behandlung von Frauen mit Krebs

Reiches Land, bessere Überlebenschance: Laut einer Lancet-Studie entscheidet das Einkommen eines Landes über den Zeitpunkt der Krebsdiagnose und die Qualität der Behandlung.

Schon 5’000 Schritte täglich könnten Alzheimer verlangsamen

Mehr Bewegung kann laut einer Studie den geistigen Abbau bremsen: Daten der Harvard Aging Brain Study zeigen, dass sich bei Menschen mit ersten Alzheimer-Anzeichen weniger Tau-Ablagerungen bilden.

Abnehmspritzen wirken – aber unabhängige Daten fehlen

Die Datenlage bei Abnehmspritzen ist einseitig: Fast alle Studien stammen von den Herstellern selbst. Forschende warnen vor Interessenkonflikten – und fordern unabhängige Langzeitstudien.