Le sommeil est depuis longtemps considéré comme un baromètre de la santé. Mais les enregistrements qui servent aujourd’hui surtout à diagnostiquer des troubles du sommeil pourraitent, demain, livrer bien davantage d’informations.
C'est à cette fin que des chercheurs de Stanford Medicine ont développé SleepFM, le premier modèle d’IA de type «foundation model» spécifiquement conçu pour analyser les données du sommeil. Leur ambition: extraire, à partir d’une seule nuit d’enregistrement, des indices sur les risques de maladies à long terme.
Un trésor de données encore sous-exploité
SleepFM s’appuie sur la polysomnographie (PSG), référence absolue en médecine du sommeil. Cette technique enregistre simultanément, durant la nuit, l’activité cérébrale (EEG), le rythme cardiaque (ECG), la respiration, la saturation en oxygène, le tonus musculaire, les mouvements oculaires et la position du corps – généralement en laboratoire spécialisé.
«Ces données sont d’une richesse exceptionnelle»,
souligne Emmanuel Mignot, professeur de médecine du sommeil à l’Université de Stanford et auteur principal de l’étude. «Mais, dans la pratique, seule une petite partie de ces informations est réellement exploitée.»
C’est précisément ce potentiel inexploité que vise SleepFM. Le modèle a été entraîné sur près de 585’000 heures de polysomnographie, issues d’environ 65’000 personnes. Plutôt que d’analyser chaque signal isolément, l’IA apprend à interpréter l’ensemble des données de manière conjointe.
Quand l'IA apprend le langage du sommeil
Sur le plan conceptuel, SleepFM s’inspire des grands modèles de langage comme ChatGPT. Les données de sommeil sont découpées en segments de cinq secondes – l’équivalent de «mots» – à partir desquels le modèle apprend des motifs, des transitions et des anomalies. «SleepFM apprend, en quelque sorte, le langage du sommeil», résume James Zou, co-senior auteur de l’étude et professeur de biomedical data science.
Une innovation clé repose sur une méthode dite de «leave-one-out contrastive learning». À chaque étape, un type de signal (par exemple l’EEG ou l’ECG) est volontairement masqué, et le modèle doit le reconstituer à partir des autres données. L’IA apprend ainsi comment cerveau, cœur, respiration et musculature fonctionnent de concert – même lorsque certaines mesures sont absentes.
Prédire les risques de maladie
La véritable avancée apparaît lorsque SleepFM est couplé à des données de santé à long terme. Pour environ 35’000 patientes et patients, les chercheurs disposaient de dossiers médicaux électroniques avec jusqu’à 25 ans de suivi. Le modèle a ainsi pu analyser plus de 1’000 catégories de maladies.
Les performances de prédiction se révèlent particulièrement élevées pour les cancers, les complications de grossesse, les maladies cardiovasculaires et les troubles psychiatriques, avec un indice C supérieur à 0,8 – contre environ 0,7 pour de nombreux modèles pronostiques utilisés en clinique.
Au total, 130 maladies ont pu être prédites avec une robustesse statistique élevée à partir des seules données du sommeil, notamment:
- les maladies neurodégénératives, comme la maladie de Parkinson (0,89) et la démence (0,85)
- les maladies cardiovasculaires, dont l’infarctus du myocarde (0,81) et la cardiopathie hypertensive (0,84)
- certains cancers, comme le cancer du sein (0,87) et de la prostate (0,89)
- la mortalité globale (0,84)
Fait notable: le modèle ne se contente pas de prédire des risques, il permet aussi d’identifier des signaux d’alerte. «L’IA ne nous explique pas ses décisions en anglais», reconnaît James Zou. «Mais nous avons développé des méthodes d’interprétation pour comprendre quels éléments elle prend en compte dans ses prédictions.»
Selon Emmanuel Mignot, les situations les plus problématiques sont souvent celles où les signaux physiologiques manquent de synchronisation: par exemple lorsque l’activité cérébrale évoque le sommeil, tandis que la respiration ou le rythme cardiaque restent proches d’un état d’éveil.
Un outil de recherche, pas un diagnostic
Les auteurs insistent toutefois sur un point essentiel: SleepFM n’est pas un outil de diagnostic clinique. Il s’agit d’un modèle de recherche, non destiné à une utilisation individuelle chez les patientes et patients.
Par ailleurs, les analyses reposent sur des polysomnographies complètes réalisées en laboratoire, et non sur des données issues de montres connectées ou de trackers d’activité. La possibilité de combiner, à l’avenir, ce type de modèle avec des données de wearables reste à explorer.
L’étude montre néanmoins avec force que le sommeil recèle bien plus d’informations que la seule qualité du repos ou l’indice d’apnée. Il constitue un véritable bilan nocturne du fonctionnement de l’organisme, qui pourrait, à terme, jouer un rôle clé en médecine préventive.