Page 30

genomique-environnementale

28 PROSPECTIVE GÉNOMIQUE ENVIRONNEMENTALE FOCUS 6-2 Stratégies Un système d’analyse anthropique des exemplaire métagénomes viraux Même si leur influence sur l’écologie de notre planète et l’évolution des organismes est recon-nue, les virus de l’environnement restent largement méconnus. Afin de les étudier sans mise en culture, les approches métagénomiques sont appliquées aux communautés virales depuis une dizaine d’années (Edwards et Rohwer 2005). Si extraire les particules encapsidées d’un échantillon n’est pas trivial, l’analyse bioinformatique des données est la principale étape limitante de telles études. En effet, les serveurs généralistes de traitement des données de métagénomique comme Mg-Rast et Camera sont adaptés aux données microbiennes mais pas aux données virales. Les spécificités des génomes viraux, en particulier l’absence de gène marqueur universel et le faible taux de séquences affiliées (moins de 30%), rendent néces-saire l’utilisation d’outils qui leur sont adaptés. Seuls deux serveurs Web spécifiques aux viromes permettent à l’heure actuelle de réaliser des analyses complètes de ces jeux de données : VIROME (Wommack et al. 2012) et Metavir (Roux et al. 2011). VIROME propose une affiliation de chaque séquence métagénomique par comparaison à des génomes de référence* mais aussi à des séquences environnementales. L’utilisation de ces dernières permet d’annoter plus de séquences et de quantifier l’abon-dance des séquences dans différents écosystèmes. Metavir tente également de faire face au faible taux de séquences affiliées au travers d’analyses utilisant l’ensemble des jeux de données : 1) estimation de la diversité génétique à partir d’une clusterisation des séquences et 2) comparaison des viromes entre eux à partir de plusieurs méthodologies (comparaisons directes des séquences ou de leurs fréquences en k-mers). L’analyse de métagénomes viraux étudiés jusqu’à présent a montré que les communautés virales sont très diversifiées et riches, le type d’environnement semblant constituer le principal facteur influençant la composition de ces communautés. En plus du faible taux de séquences affiliées, les phylogénies de gènes marqueurs de différentes familles virales réalisées par Me-tavir montrent que les séquences des viromes sont le plus souvent éloignées des séquences de référence disponibles, témoignant du fait que la grande majorité des virus de l’environne-ment nous est encore inconnue à l’heure actuelle.


genomique-environnementale
To see the actual publication please follow the link above