Page 47

genomique-environnementale

FOCUS 8-1 Sous le terme « identification taxinomique » sont regroupées deux approches centrales en taxinomie, mais bien distinctes et qui font appel à deux catégories de méthodes. Il faut distin-guer d’un côté les approches d’assignation d’un spécimen inconnu à un groupe taxinomique donné – idéalement une espèce (« specimen identification ») et de l’autre les approches de délimitation d’espèce (« species discovery/delimitation ») ou plus généralement d’inférence phylogénétique pour les rangs taxonomiques supérieurs à l’espèce. Dans les deux cas, et avant de s’intéresser aux aspects méthodologiques, il est nécessaire de rappeler l’importance cruciale de l’échantillonnage taxinomique. Ces approches reposent toutes en effet sur une évaluation pertinente de la variabilité intra et interspécifique (ou, plus généralement, intra et intergroupes), et toutes les méthodes actuellement disponibles sont sensibles à la qualité de l’échantillonnage. Afin de ne pas sous-estimer la diversité intra-groupe ou surestimer la diversité inter-groupes il faut assurer à la fois une couverture suffisante au sein des groupes mais également entre les groupes. Ainsi, pour le niveau spécifique, il s’agira, dans l’idéal, 1) de couvrir l’ensemble de l’aire de distribution de l’espèce, en incluant dans le jeu de données plusieurs spécimens par populations, et 2) de s’assurer que l’ensemble des espèces du genre étudié sont incluses dans le jeu de données. La conséquence directe de ce plan d’échantillonnage est la nécessité de prévoir une stratégie de séquençage NGS qui per-mette la prise en compte d’un (très) grand nombre de spécimens à analyser. D’un point de vue méthodologique, la communauté des taxinomistes moléculaires est très active et de nouvelles méthodes d’assignation ou de délimitation d’espèces, en plus des ap-proches de phylogénie (total evidence, supertree) devenues maintenant des classiques, sont proposées régulièrement. Elles peuvent être monolocus et sont dans ce cas adaptées pour des jeux de données incluant de nombreux spécimens, ou multilocus et sont alors limitées à un échantillonnage réduit de spécimens. Ce cadre méthodologique doit maintenant s’adapter à deux contraintes particulières liées aux approches de NGS telles qu’elles pourraient être développées dans les approches d’assignation (barcoding, metabarcoding) ou de délimitation d’espèces ou de taxons de rangs supérieurs. Tout d’abord, l’utilisation de NGS induit dans la plupart des cas un taux d’erreurs plus important qu’avec la méthode Sanger. Ce biais poten-tiel doit être pris en compte dans la conception de l’expérience, en assurant un équilibre entre nombre de locus séquencés, nombre de spécimens séquencés et couverture minimum pour chaque fragment séquencé. Ensuite, les méthodes actuelles de délimitation d’espèces sont basées soit sur une approche monolocus pour un grand nombre de spécimens, soit sur des approches multilocus pour un nombre de spécimens moyens et peu de marqueurs : il est maintenant nécessaire de développer des méthodes qui combinent les avantages des deux approches (beaucoup de marqueurs et beaucoup de spécimens) qui permettront d’analyser les données issues par exemple d’approche de type RAD-seq. taux, pourraient être performantes pour la déli-mitation des espèces et la phylogénie (Cariou et al. 2013) ; 3) le séquençage massif direct per-met d’assembler les génomes complets des or-ganelles (mitochondries et chloroplastes) et des gènes présents en grand nombre de copies dans le génome (gènes ribosomiques…) qui sont uti-lisés pour établir les phylogénies à large échelle (Focus 8-3). Appliquée à des échantillons écolo-giques, cette approche métagénomique permet de caractériser simultanément les diversités taxinomique et fonctionnelle (Focus 8-4). En plus de l’information fournie par les régions ciblées, cette approche produit des millions de courtes séquences nucléaires qui contiennent aussi une information pouvant être exploitée pour des as-signations fonctionnelles, taxinomiques ou des phylogénies. PROSPECTIVE DE L’INSTITUT ECOLOGIE ET ENVIRONNEMENT DU CNRS 45 Les défis bioinformatiques de l’identification taxinomique


genomique-environnementale
To see the actual publication please follow the link above