Diversité génétique des populations de France

Caractéristiques

Responsable scientifique E. Génin
Organisme de rattachement Inserm
Laboratoire / Lieu Brest
Année de dépôt 2019
Type de projet Recueil complémentaire

Contexte

Le développement des technologies de séquençage à haut débit a ouvert de nouvelles perspectives pour le séquençage du génome humain avec l’identification de tous les variants génétiques d’un individu. Dans chaque génome, on retrouve plus de 4 millions de différences par rapport à la séquence de référence, i.e. les variants. La majorité de ces variants sont neutres, c’est-à-dire sans impact sur le phénotype d’un individu, mais certains d’entre eux peuvent induire une maladie. Des recommandations ont été proposées pour déterminer l’implication de ces variants dans des pathologies et limiter le nombre de faux positifs. Dans ces recommandations, l’accent a été mis sur la nécessité de comparer les variants trouvés chez des patients avec des données témoins appariées autant que possible sur les origines géographiques des ascendants.

Il existe plusieurs grands panels de données de référence d’ores et déjà disponibles, comme « 1000 Genomes Project Consortium », « Exome Sequencing Project » ou « Exome Aggregation Consortium » et, qui fournissent plusieurs informations sur les variants présents dans des exomes ou des génomes entiers d’individus originaires de différentes populations, ainsi que leur fréquence respective. La population européenne y est relativement bien représentée, mais il y peu d’informations sur la région géographique d’origine de ces individus. De précédentes études utilisant les puces de SNP ont montré qu’il existe des différences de fréquences alléliques entre des populations issues d’Europe continentale ; ces différences pouvant induire des résultats faux-positifs dans les études d’association. Ces différences de fréquence allélique pour les variants communs sont également détectables entre régions d’un même pays, comme plusieurs études menées, dans différentes populations européennes, dont la France, l’ont montré. La description de ces schémas de variations génétiques stratifiées à l’échelle de la région géographique d’origine des ascendants est donc essentielle pour permettre un meilleur appariement entre les cas et les témoins dans les tests d’association. C’est d’autant plus important quand l’intérêt se porte sur les variants rares car ces derniers sont, pour la majorité, des variants apparus récemment dans des populations locales et qui ne se sont pas propagés dans de larges régions géographiques.

Avoir accès aux séquences d’ADN d’individus partageant une ascendance génétique commune avec un patient a un intérêt lors de l’analyse de génomes à visée de diagnostic. Connaître la distribution des fréquences alléliques des zones géographiques d’où sont issus les ascendants des patients sera donc indispensable pour aider à sélectionner les variants potentiellement impliqués dans une maladie ; qui, dans un second temps, devront être testés lors d’essais fonctionnels.

Un premier projet de ce genre ciblant le grand-ouest français est actuellement mené à l’Institut du Thorax de Nantes. Les premiers résultats ont montré que l’utilisation de ce panel d’individus améliore le filtrage des variants pour les analyses de génomes de patients partageant une ascendance génétique commune. Compte-tenu de ces résultats préliminaires, des efforts pour couvrir les autres régions géographiques françaises s’imposent.

Pour fournir un tel panel de la population générale française, le projet POPGEN va sélectionner 10 000 individus suivis dans la cohorte Constances ayant des ascendants originaires de différentes régions françaises, autres que celle du grand-ouest. Cette étude est un des quatre projets pilotes du plan France Médecine Génomique 2025 (FMG) qui a pour objectifs d’introduire le séquençage du génome dans la pratique clinique quotidienne pour accélérer et affiner la pose de diagnostics.

Objectifs

L’objectif principal de cette recherche est de constituer un panel de référence de génomes séquencés provenant d’individus représentatifs de la population métropolitaine française, pour aider à identifier et interpréter les variants génétiques potentiellement impliqués dans des maladies.

Les objectifs secondaires de cette recherche sont :

  • Imputer les variants génétiques des individus uniquement génotypés, à partir des 4000 génomes entiers ;

  • Décrire et étudier la diversité génétique de la population française et les mécanismes à l’origine de celle-ci ;

  • Développer des méthodes pour la réalisation de tests d’association avec des témoins appariés sur l’origine géographique de leurs ascendants.

Méthodes

Les participants seront recrutés parmi les volontaires de la cohorte Constances qui ont consenti à la transmission de leurs données et ont renseigné l’année et la commune de naissance de leurs parents et grands-parents. Parmi ces individus, 15000 seront sélectionnés aléatoirement sur les critères suivants :

  • les lieux de naissance des 4 grands-parents sont connus et regroupés dans une zone géographique,
  • la répartition homogène des regroupements en France métropolitaine.

Les volontaires sélectionnés recevront un courrier contenant : un courrier d’invitation, une notice d’information, un formulaire de consentement éclairé dupliqué et un kit d’auto-prélèvement salivaire. S’ils acceptent de participer, ils devront dater et signer le consentement éclairé et réaliser l’auto-prélèvement salivaire. Ils renverront leur échantillon salivaire ainsi qu’un exemplaire daté et signé du consentement via une enveloppe prépayée. Ces participants auront leur ADN salivaire extrait et génotypé au moyen d’une puce de SNP. Parmi ces 10000 individus, 4000 auront un séquençage du génome entier.

Aller au contenu principal