Page 60

genomique-environnementale

L’utilisation des données de polymorphisme mo-léculaire pour l’inférence des processus adapta-tifs dans les analyses NGS (Focus 9-5) nécessite de prendre en compte les interférences liées à l’histoire démographique des populations. Les outils actuels d’inférence, faisant appel notam-ment aux simulations numériques intensives de modèles basés sur la coalescence, sont gour-mands en temps de calcul et donc inadaptés aux données massives issues des NGS. L’exploi-tation optimale de ces jeux de données passe par le développement de méthodes innovantes permettant à la fois une grande flexibilité des mo-dèles sous-jacents, et une importante efficacité numérique (Gompert et Buerkle 2011, Fariello et al. 2013). La communauté scientifique de théo-riciens en génétique et génomique des popula-tions en France dispose d’atouts importants pour porter l’innovation dans ce domaine (Boitard et al. 2012, Fariello et al. 2013). Une forte limitation pour l’utilisation des NGS dans les recherches portant sur l’évolution adaptative est liée à l’accès aux plateformes de séquençage dans un cadre flexible et à un coût raisonnable. Contrairement à d’autres parties du monde où existent des plateformes univer-sitaires performantes assurant au tissu scien-tifique local un accès direct à ces technologies, les équipes françaises doivent souvent faire ap-pel à des prestataires extérieurs qui proposent un service commercial généralement standar-disé, moins à la pointe des développements ou utilisations de ces technologies, et manquant de flexibilité et de proximité par rapport à la diversi-té des questions et approches souhaitées. Une autre limitation forte réside dans la présence limitée, au sein des laboratoires, de bioinforma-ticiens sensibilisés aux défis inhérents à la bio-logie évolutive, c’est-à-dire la variabilité naturelle rencontrée dans ces domaines et le jonglage nécessaire entre les différentes approches et niveaux d’analyse. Il ressort qu’une véritable intégration entre la formulation des questions pertinentes d’un point de vue scientifique d’une part et les forces de propositions technolo-giques ou méthodologiques/bioinformatiques d’autre part apporterait la synergie nécessaire aux innovations dans ce domaine. Parmi les défis scientifiques et techniques liés à l’utilisation des données NGS pour l’étude de l’histoire évolutive des gènes et des génomes, on peut en citer 3 principaux pour lesquels la communauté française a un atout majeur à jouer dans ce domaine : 1- La détection des signatures de sélection à partir de données NGS populationnelles, les outils actuels étant en partie inopérants sur l’ensemble du génome, en raison du volume de la variation et de la complexité de sa structure au niveau génomique. 2- La variabilité naturelle intra et interspécifique qui affecte par exemple in silico l’alignement* à la référence, ou in vitro l’efficacité des captures de séquences (Nadeau et al. 2012) ; les problèmes concernent l’interprétation des estimateurs impli-quant des comparaisons inter espèces, ainsi que la qualité du multiplexage. Une meilleure docu-mentation de cette variation et une meilleure compréhension de ses effets sont cruciales. 3- Le développement d’outils bioinformatiques performants pour l’assemblage de novo pour les différents types de jeux de données, dépendant de la disponibilité des génomes de référence et/ ou affectant la possibilité de s’en affranchir. Les enjeux concernent la complexité des jeux de don-nées ainsi que la gestion de l’hétérozygotie, la polyploïdie, et les variations structurales de plus ou moins grande ampleur (indel, réarrangements, Gayral et al. 2013, Heliconius Genome Consor-tium 2012). En conclusion, les études combinant de multiples niveaux d’analyse impliquant les NGS et aboutissant à la découverte de variants génétiques permettent de tester directement les scénarios adaptatifs jusque-là spéculatifs. Cependant, le débit de production des données moléculaires excédant sou-vent la rapidité de développement de techniques d’analyse adaptées, une grande partie des études phare est associée à des innovations dans la production, l’analyse ou la combinaison des données génomiques (Baird et al. 2008). Ces innovations reposent souvent sur l’association de trois piliers : expertise en biologie des populations, plateformes de séquençage, expertise et infrastructure bioin-formatique. Elles constituent pour les institutions qui les développent des tremplins les plaçant au devant de la communauté, renforçant leur position internationale. La recherche française doit combler ce retard en permettant une meilleure synergie, à l’échelle locale, entre la formulation de questions fondamentales sur les processus adaptatifs, et les capacités de production et d’analyse des données. 58 PROSPECTIVE GÉNOMIQUE ENVIRONNEMENTALE


genomique-environnementale
To see the actual publication please follow the link above