Statistiques et bio-informatique : rôle génétique dans les traits complexes

Caractéristiques

Responsable scientifique E. Génin
Organisme de rattachement Inserm
Laboratoire / Lieu Brest
Année de dépôt 2023
Type de projet Données uniquement

Contexte

Le Plan France Médecine Génomique (pFMG) 2025 lancé en 2016 vise à intégrer le séquençage du génome dans le parcours de soin pour permettre à un nombre important de patients de bénéficier d’une prise en charge personnalisée. En effet, l’accès au séquençage et aux développements des technologies à haut débit ouvrent de nouvelles perspectives dans l’étude de la composante génétique dans les différents traits phénotypiques, aussi bien généraux que ceux liés à des pathologies, en permettant d’identifier tous les variants génétiques présents dans le génome d’un individu. Le challenge consiste à interpréter ces données génétiques et à caractériser l’effet des variants sur les phénotypes et en particulier sur la survenue des maladies et leur évolution au cours du temps. 

Objectifs

Le projet GOLD-GENOPHENOMET veut répondre à ce challenge en s’appuyant sur les données de volontaires de la cohorte Constances pour évaluer des méthodes statistiques et bioinformatiques développées par ses équipes pour trouver les facteurs génétiques impliqués dans certains phénotypes et comprendre la correspondance génotype-phénotype. L’application de ces stratégies d’analyse à des données réelles permettra d’étudier les (Version du 07 juin 2023) propriétés statistiques de ces méthodes pour en mesurer la pertinence pour des études en population générale. Les résultats obtenus permettront également de proposer de nouvelles hypothèses sur l’impact de la variabilité génétique sur les phénotypes étudiés.

Méthodes

Ces développements méthodologiques s’organisent autour de deux axes, l’un portant sur la définition des proximités phénotypiques et l’autre sur l’étude des corrélations entre ces proximités phénotypiques et des proximités génétiques. Sur l’axe phénotypique, de nouvelles approches ont été proposées pour utiliser les bases de données médico-administratives et les données longitudinales incomplètes pour définir des sous-groupes (ou clusters) de patients. En parallèle, de nouvelles méthodes ont été développées pour explorer si ces sous-groupes de patients partagent des caractéristiques génétiques communes qui pourraient expliquer leurs proximités phénotypiques.  Ces stratégies d’analyses seront appliquées aux données des volontaires de la cohorte Constances inclus dans la recherche POPGEN et qui ont consenti à la réutilisation ultérieure de leurs données. 

Perspectives

L’évaluation en situation réelle de ces stratégies d’analyse est nécessaire pour mieux comprendre les avantages et les limites de ces développements et, ainsi, les améliorer pour mieux comprendre le rôle joué par les variations génétiques sur la santé. Cette meilleure compréhension de l’impact de la génétique sur l’apparition et le développement de maladies ou de phénotypes associées permettra de proposer d’éventuelles mesures de prévention à une échelle populationnelle et une prise en charge plus efficace des malades dans le cadre du développement d’une médecine génomique. 

Informations réglementaires

Responsable de traitement

Le traitement des données est placé sous la responsabilité de l’Institut national de la santé et de la recherche médicale (Inserm), responsable du traitement des données à caractère personnel, situé au 101 rue de Tolbiac, 75 013 Paris – www.inserm.fr.

Délégué à la protection des données

Pour la cohorte et le projet : Déléguée à la protection des données de l’Inserm, dpo@inserm.fr ou 101 rue de Tolbiac, 75 013 Paris).

Base légale du traitement et recours à des données dites sensibles

Le traitement de données personnelles nécessaire à la mise en oeuvre de cette étude répond à l’exécution d’une mission d’intérêt public dont est investi l’Inserm et nécessite le traitement de données personnelles de santé à des fins de recherche scientifique.

Catégories de données concernées par les traitements

Ainsi les données de santé (issues des diagnostics validés, des examens réalisés aux centres, des questionnaires ainsi que de l’exploitation du Système National des Données de Santé), celles relatives à votre vie personnelle, comme le comportement alimentaire et la consommation de toxiques, les données génétiques et géographiques générées dans le cadre de la recherche POPGEN, seront mises à disposition des investigateurs de la recherche en France.

Destinataires ou catégories de destinataires des données à caractère personnel

Dans le cadre de cette recherche, les données seront mises à disposition des équipes de recherche coordonnées par la responsable du projet, Directrice de recherche à l’Inserm (Version du 07 juin 2023) (Institut public) au sein d’infrastructures dédiées et sécurisées (CASD et CAD). Cet accès aux données est nécessaire à la réalisation des analyses statistiques menées par les équipes de l’UMR1078 à Brest, de l’UMR1138 à Paris, de l’UMR1141 à Paris, de l’UMR1251 à Marseille, de l’UMR1083 à Angers et de l’UMR1081 à Nice.

Durée de conservation en base active des données à caractère personnel

Les données seront conservées dans les systèmes d’information du CASD et du CAD de septembre 2023 à septembre 2026. Les données seront ensuite supprimées.

Droits des personnes concernées et modalités d’exercice de ces droits

Les données nécessaires à ce projet sont traitées conformément au Règlement Général relatif à la Protection des Données « RGPD » (Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016) et à la loi n° 78-17 du 6 janvier 1978 modifiée relative à l’informatique, aux fichiers et aux libertés. L’ensemble des droits et les moyens pour les exercer sont disponibles sur : « Espace Volontaire » « Droits et protection des données ».

Aller au contenu principal