L’intelligence artificielle pour typer les diabètes

En se basant sur Constances, des chercheurs ont développé un algorithme d’intelligence artificielle qui différencie avec un taux d’exactitude de 97 % les personnes atteintes d’un diabète de type 1 et de type 2 à partir des données de l’assurance maladie. Les perspectives de ces recherches réalisées en partenariat avec Santé Publique France sont nombreuses.

En France, comme dans l’ensemble des pays industrialisés, la prévalence du diabète ne cesse d’augmenter. En 2013, 4,7 % de la population française était traitée pharmacologiquement pour un diabète selon les données de l’assurance maladie issues du SNDS. Mais différencier les personnes atteintes d’un diabète de type 1 et de type 2 est très difficile car les mêmes médicaments sont parfois utilisés pour contrôler la glycémie. Par exemple, l’injection d’insuline est administrée dans le cas d’un diabète de type 1 mais aussi pour certains diabètes de type 2.

Or, une méthode de classification fiable serait utile pour :

  1. Connaître la prévalence de ces 2 maladies dans la population française, suivre son évolution au cours du temps et mesurer l’impact de politiques de santé publique
  2. Développer la recherche en épidémiologie et pharma-épidémiologie avec notamment l’identification des facteurs favorisant l’apparition d’un diabète de type 1 ou 2
  3. Améliorer le suivi des patients en connaissant précisément les complications liées à chaque type de diabète (infarctus du myocarde, accident vasculaire cérébral, amputation d’un membre inférieur…) et en proposant des parcours de soins optimaux pour réduire ces dernières.

Apports de la cohorte Constances

Les chercheurs du projet CONSTANCES-DIAB se sont penchés sur cette question du « typage » des diabétiques en se reposant sur une extraction de données de la cohorte Constances de 2012-2014 incluant 951 volontaires traités pharmacologiquement pour un un diabète. La richesse et la diversité des données de Constances permet de reconnaitre, de façon plus précise que dans le SNDS, les sujets diabétiques et de les classer en fonction du type de diabète, et ces 951 patients ont pu ainsi servir de « gold standard » pour établir les résultats des algorithmes d’intelligence artificielle. Les chercheurs ont ainsi montré qu’il était possible de classer les malades selon leur type de diabète avec une exactitude de 97 % en utilisant un algorithme de type « machine learning » défini sans a priori à partir de 3 000 variables du SNDS : médicaments, dispositifs d’auto-surveillance et auto-traitement, actes médicaux en ville, nombre d’hospitalisations… Appliqué ensuite sur l’ensemble du SNDS, soit sur 66 millions d’adultes affiliés à la sécurité sociale, l’algorithme d’intelligence artificielle a estimé, pour la 1ère fois, les prévalences de diabète de type 1 et de type 2 dans la population adulte française.

« Couplés aux sources de Big Data comme le SNDS, les algorithmes de type « machine learning » représentent une perspective de révolution incroyable pour la recherche car on n’utilise pas des échantillons en population mais la population entière » souligne Sonsolès Fuentes qui a réalisé ce travail à Santé Publique France dans le cadre d’un doctorat soutenu le 17 septembre 2020. « Ce type d’algorithme pourrait être défini pour d’autres maladies. Leur définition, mais aussi leur actualisation, nécessitent toutefois d’avoir des bases de données très complètes et précises telles celles de la cohorte Constances. »

Communication orale :
Fuentes S, Hrzic R, Haneef R, Kab S, Cosson E and Fosse-Edorh S. L’intelligence artificielle au service de la surveillance du diabète : développement d’un algorithme de typage du diabète à partir de la cohorte Constances et application aux données du Système National des Données Santé. French-Speaking Diabetes Society Conference (Belgium, Brussels 2020).

Article soumis pour publication :
Fuentes S, Hrzic R, Haneef R, Kab S, Cosson E and Fosse-Edorh S. Artificial intelligence for diabetes research: development of type 1/type 2 classification algorithm and its application to surveillance using a nationwide population-based medicoadministrative database in France. Submitted to Diabetes Care.

Aller au contenu principal