Mensch und KI: Beide machen Fehler – aber nicht die gleichen Fehler

Wenn Mensch und KI zusammenarbeiten, erzielen sie deutlich bessere Diagnosen als medizinische Fachkräfte oder KI-Systeme allein. Das zeigt eine internationale Studie.

, 25. Juni 2025 um 05:43
letzte Aktualisierung: 11. August 2025 um 05:59
image
KI-Bild: Medinside mit Midjourney
Künstliche Intelligenz wird bekanntlich immer häufiger in der Medizin eingesetzt – was zur entscheidenden Frage führt: Wie gut funktioniert sie im Zusammenspiel mit menschlicher Expertise? Eine Studie des Max-Planck-Instituts für Bildungsforschung hat sich nun mit dieser Frage beschäftigt.
Verglichen wurde die Treffsicherheit von Einzelpersonen, menschlichen Gruppen, KI-Systemen, KI-Kollektiven – und hybriden Mensch-KI-Kollektiven.
  • Zöller, N., Berger, J., Lin, I., et al.: «Human-AI collectives most accurately diagnose clinical vignettes», in: «Proceedings of the National Academy of Sciences of the United States of America», Juni 2025.
  • Doi: 10.1073/pnas.2426153122.
Dabei zeigte sich: Die Kombination aus menschlicher Fachkompetenz und KI-Modellen führt zu signifikant besseren medizinischen Diagnosen als entweder Mensch oder Maschine allein.
«Unsere Ergebnisse zeigen, dass die Zusammenarbeit zwischen Menschen und KI-Modellen ein grosses Potenzial zur Verbesserung der Patientensicherheit hat.» Nikolas Zöller, Erstautor, Max-Planck-Institut für Bildungsforschung.
Der Grund: Mensch und Maschine machen systematisch unterschiedliche Fehler – ihre Kombination kann diese gegenseitig ausgleichen.
Bereits das Hinzufügen eines einzelnen KI-Modells zu einer Gruppe von Ärztinnen und Ärzten verbesserte die diagnostische Genauigkeit spürbar.

Realitätsnahe Fälle, systematische Bewertung

Die Studie nutzte mehr als 2'100 reale Fallvignetten aus dem Human Diagnosis Project – ein globales, kollaboratives Projekt zur medizinischen Weiterbildung. Insgesamt analysierten die Forschenden mehr als 40'000 Diagnosen, wovon jede nach dem internationalen Standard Snomed CT klassifiziert und auf Genauigkeit geprüft wurde.
Besonders wichtig: Die Diagnosen betrafen komplexe, offene medizinische Fragestellungen – nicht nur einfache Ja-Nein-Entscheidungen.
Auch wenn die Ergebnisse vielversprechend sind, mahnt Co-Autor Stefan Herzog zur Vorsicht: «Es geht nicht darum, den Menschen durch Maschinen zu ersetzen. Vielmehr sollten wir Künstliche Intelligenz als ergänzendes Werkzeug begreifen, das in der kollektiven Entscheidungsfindung sein volles Potenzial entfaltet.»
Denn: Untersucht wurden ausschliesslich textbasierte Fallbeschreibungen, keine realen Patienten. Auch behandlungsbezogene Aspekte wurden nicht berücksichtigt.
Weitere Studien seien nötig, um die Praxistauglichkeit hybrider Systeme zu belegen – etwa in Bezug auf Akzeptanz, Ethik und Bias.

Chancen für unterversorgte Regionen

Die Studie ist Teil des EU-Projekts HACID (Hybrid Human Artificial Collective Intelligence in Open-Ended Decision Making). Ziel ist es, Entscheidungsunterstützungssysteme für kritische Bereiche wie Gesundheit, Klimapolitik oder Recht zu entwickeln. Besonders in Regionen mit eingeschränktem Zugang zur Gesundheitsversorgung könnten Mensch-KI-Kollektive zur Verbesserung der Versorgungsgerechtigkeit beitragen.

  • digital & ki
Artikel teilen

Loading

Kommentar

Mehr zum Thema

image

«Sich blindlings auf KI zu verlassen, kann verheerende Folgen haben»

KI-Kameras im Universitätsspital Zürich sorgen für Diskussionen über Datenschutz und Patientensicherheit. IT-Experte Marc Ruef erklärt Chancen und Risiken. Das Interview Teil 2

image

Zwischen Standardisierung und Klumpenrisiko: Wie sicher ist der «Epic-Boom»?

Epic verspricht Standardisierung, Effizienz und hohe Sicherheitsstandards. Doch je zentraler und mächtiger ein Klinik-Informationssystem ist, desto attraktiver wird es für Angreifer, sagt IT-Experte Marc Ruef im Interview Teil 1.

image

Neues Da-Vinci-System startet in Zürich

Als erste Institution in der Schweiz nutzt die Klinik Hirslanden das Operationssystem «Da Vinci 5». Zunächst kommt es in der Viszeralchirurgie und Urologie zum Einsatz.

image

KI entdeckt in CT-Scans, ob jemand chronisch gestresst ist

Mit einem Deep-Learning-Modell wurde erstmals ein Biomarker für chronischen Stress in der Bildgebung entdeckt: Der «Adrenal Volume Index» deckt sich mit Cortisolspiegel, subjektiv wahrgenommenem Stress – und sogar mit dem Risiko für Herzinsuffizienz.

image

Digitaltherapien auf Rezept: Eine Depressions-App macht den Anfang

Die Schweiz führt ab Sommer 2026 Kostenübernahmen für digitale Therapien ein. Nun wurde eine erste Anwendung für die MiGel-Liste der Grundversicherung bewilligt.

image

Bern: Parlamentarier fordern weitere Untersuchungen zu Epic

Weil der Regierungsrat zu Kosten und Risiken kaum Transparenz zeigt, verlangen mehrere Parteien jetzt eine parlamentarische Untersuchung.

Vom gleichen Autor

image

Neuer Labortest zeigt, wie effektiv Antibiotika einzelne Bakterien töten

Statt nur das Bakterienwachstum zu beurteilen, analysiert ein neu entwickelter Test aus Basel, ob Antibiotika einzelne Erreger tatsächlich abtöten – und wenn ja, wie schnell. Die Methode könnte helfen, Therapieerfolge realistischer einzuschätzen.

image

Schweizer Team entdeckt neue Ursache für erblichen Sehverlust

Bei vielen Menschen mit Retinitis pigmentosa war die genetische Ursache bislang unklar. Eine internationale Studie unter Basler Leitung zeigt nun, dass Varianten in fünf RNA-Genen die Erkrankung auslösen können. Dies eröffnet neue Wege für Diagnostik und Therapie.

image

Game Changer bei Gonorrhö? FDA genehmigt zwei neue Medikamente

Die US-Arzneimittelbehörde hat zwei neue orale Antibiotika zur Behandlung von Tripper zugelassen. Besonders Zoliflodacin gilt als Hoffnungsträger im Kampf gegen resistente Gonokokken. In der Schweiz steigen derweil die Fallzahlen.