Le CNRS ouvre les résultats de la science
Le CNRS œuvre pour une recherche plus ouverte, notamment sur l’accès aux publications scientifiques. Cette stratégie s’accélère et s’est élargie en 2020 avec la mise en place de la Direction des données ouvertes de la recherche (DDOR). Le point sur les ambitions de l’organisme.
67 %. C’est le taux de résultats scientifiques publiés en 2019 dans les laboratoires du CNRS qui sont en accès ouvert en 2021. « Nous visons toujours l’objectif de 100 % présenté il y a un peu plus d’un an dans la feuille de route Science Ouverte du CNRS », assure Sylvie Rousset, directrice de la nouvelle Direction des données ouvertes de la recherche. La progression est « importante » puisque le taux était de 49 % pour les résultats (hors SHS) publiés en 2017
Des actions pour les publications ouvertes
Avec 1000 laboratoires en partenariat avec d’autres organismes de recherche, des universités ou des écoles, la production scientifique du CNRS représente « une grande part de la production française (au moins 40 %) », recense Sylvie Rousset. Favoriser l’accès ouvert de cette production aurait alors un « effet d’entraînement sur l’ensemble du territoire national ». Dès 2019, la DGDS a donc entrepris des actions pour impulser et renforcer le « partage de la connaissance scientifique ». C’est le cas, par exemple, de l’obligation de dépôt dans HAL, l’archive ouverte créée par le CNRS en 2001, des articles que les scientifiques désirent inclure dans leur compte-rendu annuel

Le CNRS soutient également des initiatives pour la diversité des publications en accès ouvert, hors archives. Ainsi, avec l’Université Grenoble Alpes, il a financé la publication désormais ouverte des Comptes rendus de l’Académie des sciences, jusque-là publiés par l’éditeur Elsevier. La création d’autres revues est en réflexion sur le même modèle et l’organisme entend également reconnaître et encourager l’utilisation de preprints, ces articles disponibles en ligne mais non encore soumis à des revues scientifiques avec relecture par les pairs
Partager aussi les données de la recherche
Au-delà des publications, le CNRS s’est attaqué aux données de la recherche. Un « autre défi » : plus de 60 % des laboratoires produisent des données de la recherche sans pour autant avoir nécessairement une stratégie de stockage à long terme des données produites. Alors que les centres de calcul nationaux, dans lesquels l’organisme est fortement engagé, tels l’IDRIS
Le Plan Données de la recherche du CNRS a donc été publié en novembre 2020 et met notamment en place la Direction des données ouvertes de la recherche (DDOR). Fusion de la Direction de l'information scientifique et technique (DIST) et de la Mission calcul et données (MiCaDo), elle est rattachée à la DGDS et s’organise autour de trois missions principales : proposer des politiques pour la science ouverte, les données de la recherche au sens large et le calcul intensif, recenser et proposer des services aux scientifiques et aux instituts du CNRS, faire connaître ces services et former les acteurs. Elle représente un point d’entrée unique pour l’ensemble du « continuum » de la recherche ouverte. « En réunissant tous les acteurs des petites et grandes données, du calcul et des publications au sein d’une même entité capable de prendre des décisions stratégiques, le CNRS est précurseur », prône Sylvie Rousset.

Au-delà du stockage sur lequel la communauté du calcul a « son rôle à jouer », il s’agit aussi de rendre les données FAIR – facile à trouver, accessibles, interopérables, réutilisables – avec l’aide de la communauté de l’information scientifique et technique. Ce « tour de force » que représentent les prises de décisions collectives, malgré souvent une absence même de vocabulaire commun, tire parti de l’expérience de certaines communautés plus avancées dans le stockage et le partage de données de recherche, comme celles de l’astrophysique, de la physique des particules, des sciences de la Terre ou de la génomique. « Le CNRS sera à terme capable de donner une réponse à tout chercheur ou chercheuse qui demanderait où il ou elle doit mettre ses données, comme nous pouvons déjà proposer diverses solutions pour les publications », affirme la directrice de la DDOR.
Une ambition européenne
L’initiative European Open Science Cloud (EOSC), massivement soutenue par la Commission européenne depuis 2016, est un regroupement d’infrastructures européennes capables d’offrir un catalogue de services mutualisé pour la science ouverte aux scientifiques de toute discipline, avec des processus communs unifiés. Au-delà, une articulation avec le secteur public au sens large et le secteur privé est prévue.
Plus de 190 acteurs de cet écosystème EOSC, parmi lesquels le CNRS a été membre précurseur, se sont réunis en décembre 2020 au sein d’une association EOSC
Cette accélération de la science ouverte s’inscrit également dans une volonté européenne, avec l’initiative European Open Science Cloud (voir encadré) à laquelle le CNRS participe considérablement. Au niveau de la France, le Ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI) a créé un Comité pour la science ouverte pour assurer la mise en œuvre de son plan national « visant à ouvrir à tous les publications et les données de la recherche ». Il vient de rendre publique une étude de faisabilité d’un « entrepôt générique national » pour les données scientifiques qui n’auraient pas leur place dans des entrepôts thématiques existants. Sylvie Rousset est aussi administratrice des données de la recherche pour le CNRS au sein du réseau que le MESRI met en place pour articuler les actions de tous les établissements du pays. Une réflexion à l’échelle nationale qui serait plutôt une « exception française », face par exemple aux États-Unis où l’organisation se fait plutôt à l’échelle de grandes institutions de recherche. « Il y a une véritable effervescence en ce moment autour des données de la recherche », conclut Sylvie Rousset avec enthousiasme.