Das KI-Modell Chat-GPT kann Arztberichte bis zu zehnmal schneller schreiben als menschliche Mediziner – ohne dass dabei die Qualität leidet. Das folgern Forscher der Klinik für Orthopädie und Traumatologie des Universitätsspitals Basel (USB) aus einer Pilotstudie mit sechs virtuellen Patientenfällen.
Die Studie führten sie mit schwedischen Kollegen aus dem Karolinska-Institut, dem Universitätsklinikum Uppsala und dem Danderyd-Krankenhaus durch.
«Die Möglichkeit, administrative Aufgaben wie die Zusammenfassung von Patientenaktennotizen effizienter zu gestalten, könnte erhebliche Auswirkungen auf die Arbeitsbelastung der medizinischen Fachkräfte haben und gleichzeitig die Qualität der Versorgung verbessern», betonen die Studienautoren Guillermo Sanchez Rosenberg und Andreas Müller vom USB.
Schliesslich wird heute ein grosser Teil der Arbeitszeit von Ärzten von bürokratischen Aufgaben in Anspruch genommen.
- Rosenberg, G. S., Magnéli, M., Barle, N., Kontakis, M. G., Müller, A. M., Wittauer, M., Gordon, M., & Brodén, C.: «ChatGPT-4 generates orthopedic discharge documents faster than humans maintaining comparable quality: a pilot study of 6 cases», in: «Acta Orthopaedica», 95, 152–156. März 2024.
Die Forscher wollten wissen: Wie gut und wie schnell kann Chat-GPT Arztberichte erstellen?
Sie erfanden dafür sechs Patientenfälle und schrieben dafür fiktive medizinische Aktennotizen. Daraus erstellten Chat-GPT als auch echte Fachärztinnen und -ärzte Arztberichte für die sechs Patienten. Ein 15-köpfiges Expertengremium bewertete Qualität und Erstellungsgeschwindigkeit der Berichte. Das Gremium wusste nicht, von wem die Berichte geschrieben worden waren, von Mensch oder Maschine.
Fehlerquote
Im Grossen und Ganzen war die Qualität der Berichte von KI und Mensch vergleichbar, so das Resultat. Beide machten ungefähr gleich viele Fehler, bei mehreren Berichten waren Korrekturen nötig. Aber: Das KI-Modell Chat-GPT-4 erstellte die Dokumente zehnmal schneller als die Ärzte.
Das Ziel sei die Entwicklung eines KI-Modells, das in der lokalen IT-Umgebung des Spitals laufen könne, um den Schutz der Patientendaten zu gewährleisten, so die Studienautoren weiter. Im Bericht zur Studie machen sie aber auf etwas aufmerksam: Die von der KI erstellten Berichte müssen – genau so, wie es heute bereits mit herkömmlich erstellten Dokumenten der Fall ist – von Menschenhand überprüft werden.
Weitere Studie
In Kürze soll eine weitere Studie gestartet werden, bei der die Forschenden 1’000 medizinische Patientenakten von Chatbots und Menschen parallel zusammenfassen lassen wollen. Die Herausforderung liegt hier vor allem beim Schutz der Patientendaten und beim Datenmanagement.