Page 48

genomique-environnementale

Outre les difficultés techniques liées à l’utili-sation des NGS (erreurs de séquençage, diffi-cultés d’interprétation des données en termes quantitatifs à partir d’échantillons environne-mentaux), plusieurs limitations conceptuelles et méthodologiques existent. L’utilisation de code-barres multilocus permet une approche moins réductrice de la définition des taxons en se basant sur un plus grand nombre de caractères non liés. Cependant, des diffé-rences persisteront probablement à l’échelle de larges spectres taxinomiques notamment en raison de l’absence de génomes complets de référence pour des compartiments entiers de l’arbre du vivant. De plus, se pose la ques-tion de l’homologie des marqueurs entre orga-nismes comparés et donc celle de la profon-deur phylogénétique du signal obtenu. Ces approches produisent, au moins pour partie, des données non standardisées dont le traite-ment dans des approches comparatives est non trivial (e.g. quelques millions de courtes séquences représentant une fraction variable d’un génome pas toujours comparable d’un or-ganisme à l’autre). Le test des hypothèses sur l’homologie des marqueurs ne peut être réa-lisé qu’avec un échantillonnage taxinomique pertinent en fonction de la profondeur phylo-génétique envisagée (Focus 8-2). La question de la complétude des données de référence, et donc l’impact des données manquantes sur la qualité des inférences, qui se pose déjà quand seuls quelques marqueurs standardisés sont utilisés, est ici encore accrue. Dans ce contexte, deux principaux défis sont à relever. Il faut d’une part compléter les bases de référence en augmentant leur couverture taxinomique. Cela concerne les barre-codes standards, des régions standardisées (e.g. génomes mitochondriaux complets, Dettai et al. 2012) mais aussi toutes les données gé-nomiques non standardisées pour lesquelles cette couverture taxinomique est indispen-sable pour résoudre les questions d’homologie (génomes partiels, données de RAD-seq...). Ainsi, la réussite de ces nouvelles approches est conditionnée par le développement de méthodes d’assignation taxinomique et d’infé-rence phylogénétique prenant en compte les er-reurs de séquençage, la dégradation de l’ADN notamment dans les études paléogénomiques (Focus 8-4), et exploitant au maximum l’infor-mation issue des données disponibles pour les marqueurs standards et/ou les données génomiques partielles (Coissac et al. 2012, Focus 8-5). La réussite de ces développements nécessite des actions coordonnées à l’interface entre taxi-nomie, écologie, biologie moléculaire et bio-in-formatique, via le financement de projets pilotes ciblant par exemple le développement de proto-coles et de méthodes d’analyses compatibles avec les études systématiques et écologiques. Il est également essentiel de développer des bases de données de référence cohérentes avec les approches NGS, faisant le lien entre données génétiques, spécimens de collections et collec-tions d’ADN durables qui soient mobilisables dans le futur pour les nouveaux développe-ments technologiques. Dans ce cadre, un sou-tien particulier devrait être accordé aux études taxinomiques ciblant les groupes d’intérêt phylo-génétique ou écologique. 46 PROSPECTIVE GÉNOMIQUE ENVIRONNEMENTALE


genomique-environnementale
To see the actual publication please follow the link above