Page 62

genomique-environnementale

60 PROSPECTIVE GÉNOMIQUE ENVIRONNEMENTALE FOCUS 9-4 Génome de référence et reséquençage populationnel : origines de la convergence évolutive chez les papillons Heliconius Le genre néotropical Heliconius montre une radiation-diversification spectaculaire liée au mimétisme (Joron et al. 2006, Figure 9F) ; un nombre croissant d’équipes s’intéresse aux déterminants génétiques de leur convergence. Afin d’obtenir un génome complet de référence, ces équipes se sont liées de manière informelle en un consortium international (www.heliconius.org) pour profiter de l’essor des NGS dès ses débuts et séquencer le génome de l’espèce H. melpomene (génome haploïde de 295Mb, Heliconius Genome Consortium 2012). Le pyroséquençage* 454 Roche, au débit faible face à Illumina mais aux lectures longues de 400bp, fut adopté initialement pour obtenir un premier assemblage (12M de lectures sur un individu consanguin). Le séquençage Illumina par paires, et notamment le séquençage dit « mate-pair » par circularisation de fragments longs (3kb et 5kb), fut ensuite utilisé pour associer en scaffolds les contigs séparés par des séquences répétées (8M de paires de lectures). Ensuite, le développement de lectures de 100bp par Illumina HiSeq a permis d’obtenir 42M de paires de lectures supplémentaires, permettant d’améliorer la couverture moyenne et corriger les erreurs inhérentes au pyroséquençage. L’assemblage final est alors de ~269Mb (91% du génome, 3800 scaffolds, N50=277Kb). Enfin, les individus issus d’un croisement Mendélien entre la lignée consanguine et une lignée divergente ont été génotypés par Illumina RAD-seq pour réaliser une cartographie génétique, permettant d’ordonner et d’orienter sur chaque chromosome les scaffolds génomiques contenant des marqueurs RAD (superassemblage de 83% du génome, 1273 superscaffolds, N50=400Kb) (www.butterflygenome.org). Les technologies et les méthodes analytiques, en plein développement, ont changé drastiquement au cours du déroulement du projet (4 ans). La stratégie de séquençage fut continuellement adaptée à la puissance croissante des technologies, ainsi qu’aux problèmes d’assemblage rencontrés. Ces pro-blèmes concernent principalement l’hétérozygotie du génome qui rend l’assemblage difficile, et sa structure haplotypique qui produit une duplication artefactuelle des segments fortement hétérozygotes. Le séquençage de banques génomiques de tailles variées et l’implémentation de stratégies bioinforma-tiques ad hoc (grâce aux postdoctorants issus de laboratoires spécialisés) ont permis de résoudre en partie ces problèmes (Heliconius Genome Consortium 2012). Le génome obtenu est très utile en l’état pour une grande gamme d’applications, mais restera continuellement en phase d’amélioration. A


genomique-environnementale
To see the actual publication please follow the link above