Page 23

genomique-environnementale

V ACCÈS ET PARTAGE DES DONNÉES NGS Coordinateurs : Eric Pelletier et Guy Perrière La recherche en génomique environnementale est en train de vivre une véritable révolution de l’information. Sont mis à disposition de la communauté scientifique des jeux de données de plus en plus importants, pour un nombre croissant d’organismes, ainsi que pour de nombreux gènes et écosystèmes. Ces nouveaux jeux de données, alliés à une puissance de calcul et à une sophistica-tion des logiciels (rendues possibles par la mise en place de plateformes collaboratives comme R) offrent aujourd’hui une profondeur d’analyse qui n’était pas possible il y a encore dix ans. Toutefois l’avalanche de ces données dans le domaine des omiques est telle que l’on se heurte aujourd’hui aux difficultés qui en font leur succès en ce qui concerne leur accès et leur partage. Accès aux banques de données NGS La possibilité d’accéder rapi-dement et de façon exhaustive aux séquences génomiques est l’une des raisons du succès qu’a rencontré la bioinformatique au cours des trente dernières années. Or, l’arrivée en 2005 des premières méthodes à haut débit (Margulies et al. 2005), puis leur démocratisation dans les années 2010, a entraîné une véritable révolution dans ce do-maine (Shendure et Lieberman Aiden 2012). En effet, si les instituts en charge de la maintenance des banques ont pu gérer pendant trois décen-nies un flux sans cesse croissant de données, ce n’est désormais plus le cas. Faisant face à un déluge sans précédent de séquences (géno-miques ou transcriptomiques), ces organismes doivent désormais s’adapter et ici, comme dans de nombreux autres domaines des sciences et de la technologie, l’avenir appartient aux structures en réseau et non plus à de grands systèmes centralisés. Depuis près de trente ans, les trois grandes banques généralistes de données collectant les séquences génomiques sont GenBank au Natio-nal Center for Biotechnology Information (Benson et al. 2013), l’ENA (European Nucleotide Archive), ex-EMBL, à l’European Bioinformatics Institute (EBI, Cochrane et al. 2013) et la DDBJ (DNA Data Bank of Japan) au National Institute of Genetics (Ogasawara et al. 2013). Bien qu’à leurs débuts le contenu et la taille de ces trois banques étaient relativement différents, une collaboration internationale s’est rapidement établie et, depuis PROSPECTIVE DE L’INSTITUT ECOLOGIE ET ENVIRONNEMENT DU CNRS 21


genomique-environnementale
To see the actual publication please follow the link above