Statistiques et bio-informatique : rôle génétique dans les traits complexes

Accueil
Espace scientifique
Recherche et études
Statistiques et bio-informatique : rôle génétique dans les traits complexes

Caractéristiques

Responsable scientifique E. Génin

Organisme de rattachement Inserm

Laboratoire / Lieu Brest

Année de dépôt 2023

Type de projet Données uniquement

Contexte

Le Plan France Médecine Génomique (pFMG) 2025 lancé en 2016 vise à intégrer le séquençage du génome dans le parcours de soin pour permettre à un nombre important de patients de bénéficier d’une prise en charge personnalisée. En effet, l’accès au séquençage et aux développements des technologies à haut débit ouvrent de nouvelles perspectives dans l’étude de la composante génétique dans les différents traits phénotypiques, aussi bien généraux que ceux liés à des pathologies, en permettant d’identifier tous les variants génétiques présents dans le génome d’un individu. Le challenge consiste à interpréter ces données génétiques et à caractériser l’effet des variants sur les phénotypes et en particulier sur la survenue des maladies et leur évolution au cours du temps.

Objectifs

Le projet GOLD-GENOPHENOMET veut répondre à ce challenge en s’appuyant sur les données de volontaires de la cohorte Constances pour évaluer des méthodes statistiques et bioinformatiques développées par ses équipes pour trouver les facteurs génétiques impliqués dans certains phénotypes et comprendre la correspondance génotype-phénotype. L’application de ces stratégies d’analyse à des données réelles permettra d’étudier les propriétés statistiques de ces méthodes pour en mesurer la pertinence pour des études en population générale. Les résultats obtenus permettront également de proposer de nouvelles hypothèses sur l’impact de la variabilité génétique sur les phénotypes étudiés.

Méthodes

Ces développements méthodologiques s’organisent autour de deux axes, l’un portant sur la définition des proximités phénotypiques et l’autre sur l’étude des corrélations entre ces proximités phénotypiques et des proximités génétiques. Sur l’axe phénotypique, de nouvelles approches ont été proposées pour utiliser les bases de données médico-administratives et les données longitudinales incomplètes pour définir des sous-groupes (ou clusters) de patients. En parallèle, de nouvelles méthodes ont été développées pour explorer si ces sous-groupes de patients partagent des caractéristiques génétiques communes qui pourraient expliquer leurs proximités phénotypiques. Ces stratégies d’analyses seront appliquées aux données des volontaires de la cohorte Constances inclus dans la recherche POPGEN et qui ont consenti à la réutilisation ultérieure de leurs données.

Perspectives

L’évaluation en situation réelle de ces stratégies d’analyse est nécessaire pour mieux comprendre les avantages et les limites de ces développements et, ainsi, les améliorer pour mieux comprendre le rôle joué par les variations génétiques sur la santé. Cette meilleure compréhension de l’impact de la génétique sur l’apparition et le développement de maladies ou de phénotypes associées permettra de proposer d’éventuelles mesures de prévention à une échelle populationnelle et une prise en charge plus efficace des malades dans le cadre du développement d’une médecine génomique.

Informations réglementaires

Responsable de traitement

Le traitement des données à caractère personnel est placé sous la responsabilité de l’Institut national de la santé et de la recherche médicale (Inserm) situé au 101 rue de Tolbiac, 75 013 Paris – www.inserm.fr

Délégué à la protection des données

Pour la cohorte et l’étude : Déléguée à la protection des données de l’Inserm, dpo@inserm.fr ou 101 rue de Tolbiac, 75 013 Paris.

Base légale du traitement et recours à des données dites sensibles

Le traitement de données personnelles nécessaire à la mise en oeuvre de cette étude répond à l’exécution d’une mission d’intérêt public dont est investi l’Inserm et nécessite le traitement de données personnelles de santé à des fins de recherche scientifique.

Catégories de données concernées par les traitements

Les données de santé (issues des diagnostics validés, des examens réalisés aux centres, des questionnaires ainsi que de l’exploitation du Système National des Données de Santé), celles relatives à votre vie personnelle, comme le comportement alimentaire et la consommation de toxiques, les données génétiques et géographiques générées dans le cadre de la recherche POPGEN, seront mises à disposition des investigateurs de la recherche en France.

Destinataires ou catégories de destinataires des données à caractère personnel

Dans le cadre de cette étude, les données seront mises à disposition de la responsable de l’étude, directrice de recherche à l’Inserm (Institut public), France. Cette mise à disposition est nécessaire à la réalisation des analyses statistiques menées par l’équipe en charge de l’étude.

Durée de conservation en base active des données à caractère personnel

Les données seront conservées dans les systèmes d’information sécurisés du responsable de traitement pendant 3 ans, de novembre 2024 à novembre 2027. Par ailleurs, les données sont archivées à l’UMS11 dans le cadre de l’autorisation initiale de la cohorte Constances jusqu’en 2041.

Droits des personnes concernées et modalités d’exercice de ces droits

Les données nécessaires à cette étude sont traitées conformément au Règlement général relatif à la protection des données « RGPD » (Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016) et à la loi n° 78-17 du 6 janvier 1978 modifiée relative à l’informatique, aux fichiers et aux libertés. L’ensemble des droits et les moyens pour les exercer sont disponibles sur le site Internet de la cohorte : https://www.constances.fr/ « Espace Volontaires » « Droits et protection des données ». Il est également possible de s’adresser au responsable de traitement de cette étude, par l’intermédiaire de son/sa déléguée à la protection des données DPO (coordonnées indiquées ci-dessus).