Le CNRS ouvre les résultats de la science

CNRS

Le CNRS œuvre pour une recherche plus ouverte, notamment sur l’accès aux publications scientifiques. Cette stratégie s’accélère et s’est élargie en 2020 avec la mise en place de la Direction des données ouvertes de la recherche (DDOR). Le point sur les ambitions de l’organisme.

67 %. C’est  le taux de résultats scientifiques publiés en 2019 dans les laboratoires du CNRS qui sont en accès ouvert en 2021. « Nous visons toujours l’objectif de 100 % présenté il y a un peu plus d’un an dans la  feuille de route Science Ouverte du CNRS », assure Sylvie Rousset, directrice de la nouvelle Direction des données ouvertes de la recherche. La progression est « importante » puisque le taux était de 49 % pour les résultats (hors SHS) publiés en 20171, et 59 % pour les SHS (voir infographie). La politique pour la Science Ouverte menée par la Direction générale déléguée à la science (DGDS) du CNRS « porte donc ses fruits », notamment au sujet de l’archivage pérenne des publications dans les archives ouvertes.

Des actions pour les publications ouvertes

Avec 1000 laboratoires en partenariat avec d’autres organismes de recherche, des universités ou des écoles, la production scientifique du CNRS représente « une grande part de la production française (au moins 40 %) », recense Sylvie Rousset. Favoriser l’accès ouvert de cette production aurait alors un « effet d’entraînement sur l’ensemble du territoire national ». Dès 2019, la DGDS a donc entrepris des actions pour impulser et renforcer le « partage de la connaissance scientifique ». C’est le cas, par exemple, de l’obligation de dépôt dans HAL, l’archive ouverte créée par le CNRS en 2001, des articles que les scientifiques désirent inclure dans leur compte-rendu annuel2 (le CRAC), d’abord sous forme de notice puis en texte intégral depuis 2020. Aujourd’hui, plus de 90 % des publications en accès ouvert du CNRS le sont via des archives ouvertes et 7 chercheurs et chercheuses sur 10 ont demandé un identifiant pour déposer des articles dans ces archives.

Statistiques sur les publications ouvertes ou fermées au CNRS et en France

Le CNRS soutient également des initiatives pour la diversité des publications en accès ouvert, hors archives. Ainsi, avec l’Université Grenoble Alpes, il a financé la publication désormais ouverte des Comptes rendus de l’Académie des sciences, jusque-là publiés par l’éditeur Elsevier. La création d’autres revues est en réflexion sur le même modèle et l’organisme entend également reconnaître et encourager l’utilisation de preprints, ces articles disponibles en ligne mais non encore soumis à des revues scientifiques avec relecture par les pairs3 : « la publication de preprints sur un serveur permet de prendre date d’une découverte, tout en rendant le résultat scientifique immédiatement accessible », explique Sylvie Rousset, rappelant que ces publications, qui ont été souvent dynamisées par la pandémie de Covid-19, peuvent désormais être incluses dans le CRAC.

Partager aussi les données de la recherche

Au-delà des publications, le CNRS s’est attaqué aux données de la recherche. Un « autre défi » : plus de 60 % des laboratoires produisent des données de la recherche sans pour autant avoir nécessairement une stratégie de stockage à long terme des données produites. Alors que les centres de calcul nationaux, dans lesquels l’organisme est fortement engagé, tels l’IDRIS4 qui héberge le calculateur Jean Zay, ont les capacités et les compétences pour gérer et stocker les « big data » qu’ils produisent ou qui sont issues d’expériences internationales, « il ne reste plus qu’un pas à faire » pour aller vers ces « petites » données, « quotidiennement perdues » et pourtant indispensables à la compréhension des publications.

Le Plan Données de la recherche du CNRS a donc été publié en novembre 2020 et met notamment en place la Direction des données ouvertes de la recherche (DDOR). Fusion de la Direction de l'information scientifique et technique (DIST) et de la Mission calcul et données (MiCaDo), elle est rattachée à la DGDS et s’organise autour de trois missions principales : proposer des politiques pour la science ouverte, les données de la recherche au sens large et le calcul intensif, recenser et proposer des services aux scientifiques et aux instituts du CNRS, faire connaître ces services et former les acteurs. Elle représente un point d’entrée unique pour l’ensemble du « continuum » de la recherche ouverte. « En réunissant tous les acteurs des petites et grandes données, du calcul et des publications au sein d’une même entité capable de prendre des décisions stratégiques, le CNRS est précurseur », prône Sylvie Rousset.

Organisation de la DDOR

Au-delà du stockage sur lequel la communauté du calcul a « son rôle à jouer », il s’agit aussi de rendre les données FAIR – facile à trouver, accessibles, interopérables, réutilisables – avec l’aide de la communauté de l’information scientifique et technique. Ce « tour de force » que représentent les prises de décisions collectives, malgré souvent une absence même de vocabulaire commun, tire parti de l’expérience de certaines communautés plus avancées dans le stockage et le partage de données de recherche, comme celles de l’astrophysique, de la physique des particules, des sciences de la Terre ou de la génomique. « Le CNRS sera à terme capable de donner une réponse à tout chercheur ou chercheuse qui demanderait où il ou elle doit mettre ses données, comme nous pouvons déjà proposer diverses solutions pour les publications », affirme la directrice de la DDOR.

  • 1. Et 60 % pour les résultats publiés en 2018.
  • 2. Le compte rendu annuel d'activité des chercheurs CNRS (CRAC) est un résumé des points forts de l'activité de recherche du chercheur ou de la chercheuse, et des différentes autres activités liées au métier.
  • 3. Certains serveurs de prépublications proposent une relecture par les pairs hors soumission à une revue scientifique.
  • 4. Institut du développement et des ressources en informatique scientifique (CNRS).

Une ambition européenne

L’initiative European Open Science Cloud (EOSC), massivement soutenue par la Commission européenne depuis 2016, est un regroupement d’infrastructures européennes capables d’offrir un catalogue de services mutualisé pour la science ouverte aux scientifiques de toute discipline, avec des processus communs unifiés. Au-delà, une articulation avec le secteur public au sens large et le secteur privé est prévue.

Plus de 190 acteurs de cet écosystème EOSC, parmi lesquels le CNRS a été membre précurseur, se sont réunis en décembre 2020 au sein d’une association EOSC5. Représenté par Sylvie Rousset, directrice de la DDOR, le CNRS s’est engagé en tant que membre de l’association et travaille en étroite collaboration avec d’autres organismes de recherche français membres ou observateurs, dont Inria qui a été choisi par le Ministère de l’Enseignement supérieur et de la Recherche pour représenter les intérêts de la France. Une implication « stratégique » pour le CNRS, assure Suzanne Dumouchel, ingénieure de recherche à la TGIR Huma-Num et chargée de mission à la DDOR, qui vient d’être élue membre du directoire de l’association pour un mandat de trois ans, parmi huit directeurs et directrices européens. « Le CNRS, qui entend promouvoir la science ouverte par tous les moyens et donc naturellement via EOSC, est une des rares organisations qui peut le faire pour toutes les disciplines à la fois », ajoute-t-elle. L’objectif commun est d’harmoniser les besoins des communautés de recherche françaises en termes d’infrastructure de calculs, gestion de données ou encore visualisation, et ainsi promouvoir la création d’un « EOSC français » pour « rendre les recherches plus visibles et plus innovantes », projet sur lequel le CNRS est « moteur ». La stratégie de l’association EOSC devrait être dévoilée à la fin de l’année.

  • 5. Association de type AISBL (association internationale de droit belge).

Cette accélération de la science ouverte s’inscrit également dans une volonté européenne, avec l’initiative European Open Science Cloud (voir encadré) à laquelle le CNRS participe considérablement. Au niveau de la France, le Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI) a créé un Comité pour la science ouverte pour assurer la mise en œuvre de son plan national « visant à ouvrir à tous les publications et les données de la recherche ». Il vient de rendre publique une étude de faisabilité d’un « entrepôt générique national » pour les données scientifiques qui n’auraient pas leur place dans des entrepôts thématiques existants. Sylvie Rousset est aussi administratrice des données de la recherche pour le CNRS au sein du réseau que le MESRI met en place pour articuler les actions de tous les établissements du pays. Une réflexion à l’échelle nationale qui serait plutôt une « exception française », face par exemple aux États-Unis où l’organisation se fait plutôt à l’échelle de grandes institutions de recherche. « Il y a une véritable effervescence en ce moment autour des données de la recherche », conclut Sylvie Rousset avec enthousiasme.