En se basant sur Constances, des chercheurs ont développé un algorithme d’intelligence artificielle qui différencie avec un taux d'exactitude de 97 % les personnes atteintes d’un diabète de type 1 et de type 2 à partir des données de l’assurance maladie. Les perspectives de ces recherches réalisées en partenariat avec Santé Publique France sont nombreuses.
En France, comme dans l’ensemble des pays industrialisés, la prévalence du diabète ne cesse d’augmenter. En 2013, 4,7 % de la population française était traitée pharmacologiquement pour un diabète selon les données de l’assurance maladie issues du SNDS. Mais différencier les personnes atteintes d’un diabète de type 1 et de type 2 est très difficile car les mêmes médicaments sont parfois utilisés pour contrôler la glycémie. Par exemple, l’injection d’insuline est administrée dans le cas d’un diabète de type 1 mais aussi pour certains diabètes de type 2.
Or, une méthode de classification fiable serait utile pour :
Apports de la cohorte Constances
Les chercheurs du projet CONSTANCES-DIAB se sont penchés sur cette question du « typage » des diabétiques en se reposant sur une extraction de données de la cohorte Constances de 2012-2014 incluant 951 volontaires traités pharmacologiquement pour un un diabète. La richesse et la diversité des données de Constances permet de reconnaitre, de façon plus précise que dans le SNDS, les sujets diabétiques et de les classer en fonction du type de diabète, et ces 951 patients ont pu ainsi servir de « gold standard » pour établir les résultats des algorithmes d’intelligence artificielle. Les chercheurs ont ainsi montré qu’il était possible de classer les malades selon leur type de diabète avec une exactitude de 97 % en utilisant un algorithme de type « machine learning » défini sans a priori à partir de 3 000 variables du SNDS : médicaments, dispositifs d’auto-surveillance et auto-traitement, actes médicaux en ville, nombre d’hospitalisations… Appliqué ensuite sur l’ensemble du SNDS, soit sur 66 millions d’adultes affiliés à la sécurité sociale, l’algorithme d’intelligence artificielle a estimé, pour la 1ère fois, les prévalences de diabète de type 1 et de type 2 dans la population adulte française (voir graphe ci-dessous).
« Couplés aux sources de Big Data comme le SNDS, les algorithmes de type « machine learning » représentent une perspective de révolution incroyable pour la recherche car on n’utilise pas des échantillons en population mais la population entière » souligne Sonsolès Fuentes qui a réalisé ce travail à Santé Publique France dans le cadre d’un doctorat soutenu le 17 septembre 2020. « Ce type d’algorithme pourrait être défini pour d’autres maladies. Leur définition, mais aussi leur actualisation, nécessitent toutefois d’avoir des bases de données très complètes et précises telles celles de la cohorte Constances. »
Communication orale Fuentes S, Hrzic R, Haneef R, Kab S, Cosson E and Fosse-Edorh S. L’intelligence artificielle au service de la surveillance du diabète : développement d’un algorithme de typage du diabète à partir de la cohorte Constances et application aux données du Système National des Données Santé. French-Speaking Diabetes Society Conference (Belgium, Brussels 2020).
Article soumis pour publication Fuentes S, Hrzic R, Haneef R, Kab S, Cosson E and Fosse-Edorh S. Artificial intelligence for diabetes research: development of type 1/type 2 classification algorithm and its application to surveillance using a nationwide population-based medicoadministrative database in France. Submitted to Diabetes Care.