L’intelligence artificielle (IA) est de plus en plus utilisée en médecine et soulève de nombreuses questions, notamment concernant son interaction avec l’expertise humaine. C’est précisément ce sur quoi s’est penchée l’
Institut Max Planck pour la recherche en éducation lors d'une étude.
Cette étude a comparé la précision diagnostique des individus, des groupes humains, des systèmes d’IA, des collectifs d’IA – ainsi que des collectifs hybrides humains/IA.
Il en ressort que la combinaison de l’expertise humaine et des modèles d’IA permet d’obtenir des diagnostics médicaux significativement plus précis que ceux posés par un professionnel de santé seul ou générés uniquement par une intelligence artificielle.
«Nos résultats montrent que la collaboration entre les humains et les modèles d'IA a le potentiel d'améliorer considérablement la sécurité des patients.» —Nikolas Zöller, Institut Max Planck pour la recherche en éducation.
La raison en est simple: humains et machines commettent des erreurs différentes, qui peuvent se compenser mutuellement lorsqu’ils travaillent ensemble.
L’ajout d’un seul modèle d’IA à un groupe de médecins suffit déjà à améliorer sensiblement la précision du diagnostic.
Cas proches de la réalité, évaluation systématique
L'étude s'est appuyée sur plus de 2'100 cas réels issus du
Human Diagnosis Project, un projet collaboratif mondial de formation médicale continue. Au total, les chercheurs ont analysé plus de 40'000 diagnostics, chacun ayant été classé selon la norme internationale
Snomed CT et dont l'exactitude a été vérifiée.
Point particulièrement important: ces diagnostics portaient sur des problématiques médicales complexes et ouvertes, dépassant le cadre de simples décisions binaires «oui/non».
Même si les résultats sont prometteurs, Stefan Herzog, coauteur de l'étude, appelle à la prudence: «Il ne s'agit pas de remplacer l'être humain par des machines. Nous devrions plutôt considérer l'intelligence artificielle comme un outil complémentaire qui déploie tout son potentiel dans la prise de décision collective.»
En effet, l’étude repose uniquement sur des descriptions de cas textuelles, et non sur l’observation de patients réels. Les aspects liés aux traitements médicaux n’ont pas été pris en compte non plus.
D’autres études seront nécessaires pour confirmer la pertinence des systèmes hybrides en situation réelle, notamment en ce qui concerne leur acceptation, les enjeux éthiques et les risques de biais.
Opportunités pour les régions mal desservies
L’étude s’inscrit dans le cadre du projet européen
HACID (Hybrid Human Artificial Collective Intelligence in Open-Ended Decision Making), dont l’objectif est de développer des systèmes d’aide à la décision pour des domaines critiques tels que la santé, la politique climatique ou le droit. Dans les régions où l’accès aux soins est limité, ces dispositifs combinant IA et expertise humaine pourraient contribuer à améliorer l’équité en matière de santé.