Page 46

genomique-environnementale

44 PROSPECTIVE GÉNOMIQUE ENVIRONNEMENTALE Absence de plan d’échantillonage des taxons et des gènes Barcoding monolocus Barcoding génomique Figure 8A. Echantillonnage, barcoding et classification taxinomique à l’ère des NGS. De gauche à droite, la classification acceptée d’un taxon donné, le nombre de spécimens échantillonné pour le rang le plus inclusif est indiqué entre parenthèse (i.e. espèce), la distribution des distances obtenues en fonction du marqueur choisi et la phylogénie inférée (en pointillé la phylogénie résolue correspondant à la taxinomie acceptée). En haut : situation sans plan d’échantillonnage taxinomique et choix des marqueurs guidé par la disponibilité des données (e.g. données extraites de Genbank), les espèces sont échantillonnées en fonction d’autres études (e.g. espèces modèles, espèces emblématiques, etc …), la distribution des distances génétiques n’est pas clairement multi-modale, les marqueurs génétiques ne sont pas résolutifs à toutes les profondeurs de l’arbre. Au milieu : situation du type DNA-barcoding classique (monolocus) : la plupart des espèces connues du taxon sont échantillonnées, généralement avec plusieurs spécimens par espèce, les marqueurs génétiques utilisées ne sont discriminants qu’à un rang donné (e.g. rang espèces) et la distribution des distances génétiques est bimodale. En bas : situation idéale (barcoding génomique) : toutes les espèces du taxon sont échantillonnées avec le même nombre de spécimens, les marqueurs génétiques utilisés couvrent largement le génome et permettent de reconstruire une phylogénie robuste à tous les rangs taxinomiques, la distribution des distances génétiques est multimodale. La difficulté réside dans les besoins contradic-toires de la standardisation des données de référence, de l’étude de la diversité des orga-nismes et des contraintes techniques liées aux échantillons étudiés. Il est en effet difficile de concilier les propriétés nécessaires pour qu’un code-barre ADN soit à la fois performant pour les études taxinomiques et écologiques (Valen-tini et al. 2009). Les très grands nombres de séquences fournis par les NGS rendent envisa-geable le développement de code-barres multi-locus (combinaisons de nombreux fragments courts) couvrant mieux les génomes et utilisables dans différents types d’études. Les fragments courts permettent de caractériser des ADN en-vironnementaux dégradés, le grand nombre de marqueurs fournissant suffisamment de carac-tères moléculaires pour avoir une bonne réso-lution taxinomique et un signal phylogénétique conséquent. Par ailleurs, les fragments d’ADN sont actuellement caractérisés par séquençage après amplification par PCR. Cette étape est génératrice de biais et d’erreurs, et contraint for-tement la définition des code-barres ADN à des régions encadrées par des sites conservés pour permettre la fixation des amorces. Plusieurs approches basées sur les NGS permettraient de s’affranchir de ces problèmes : 1) les mé-thodes de capture (voir chapitre XI) permettent, sans recours à la PCR, de sélectionner pour le séquençage ultérieur des code-barres cibles grâce à des sondes complémentaires de régions conservées incluses dans ces fragments ; 2) les méthodes basées sur le RAD-seq (Focus 8-2), bien qu’inutilisables pour caractériser les ADN dégradés issus d’échantillons environnemen-


genomique-environnementale
To see the actual publication please follow the link above