Un financement pour l’EquipEx en sciences humaines et sociales COMMONS

Recherche

16 projets coordonnés par le CNRS ont été retenus suite à l’appel à manifestation d’intérêt EquipEx+ du Programme d’investissements d’avenir, comme COMMONS qui promeut la science ouverte en SHS. Un soutien financier qui touche toutes les sciences.

Dans le cadre du Programme d’investissements d’avenir (PIA)1, l’État français investit et soutient les équipements scientifiques nécessaires au maintien de l’excellence et du leadership de la recherche nationale. En décembre dernier, 50 projets ont ainsi été retenus pour un financement total de 422 M€ dans le cadre de l’action « Équipements structurants pour la recherche : EquipEx+ ».

Parmi les lauréats, 16 projets de domaines scientifiques variés sont coordonnés par le CNRS (voir encadré). Par exemple en sciences de la matière et de l’énergie, le projet NANOFUTUR est un consortium de 19 partenaires sur le territoire national, dédié à l’identification d’équipements afin de répondre aux défis en nanofabrication et nanotechnologies. Il est porté par la communauté académique française des nanotechnologies et fédère le réseau RENATECH+. TERRA FORMA en sciences du système terre-univers-environnement développe, quant à lui, un réseau de capteurs intelligents à travers le territoire pour le suivi des écosystèmes.

Le CNRS coordonne également de nombreux projets en sciences du numérique et mathématiques et en sciences humaines et sociales. C’est le cas du Consortium de moyens mutualisés pour des services et données ouvertes en SHS (projet COMMONS) visant à développer la dynamique de science ouverte dans ces disciplines. « Ce projet s’inscrit dans le plan stratégique « Données de la recherche » du CNRS, qui veut rendre les données « FAIR » : faciles à trouver, accessibles, interopérables, réutilisables », précise Lionel Maurel, directeur adjoint scientifique à l’Institut des sciences humaines et sociales (INSHS) du CNRS. À cet effet, le projet disposera d’un financement de plus de 10 millions d’euros répartis sur une durée de 8 ans. COMMONS s’adresse à la fois au monde académique international et à la société au sens large.

Répondre aux enjeux de la science ouverte en SHS

Les sciences humaines et sociales regroupent un large éventail de disciplines offrant une grande richesse et variété de thématiques de recherche. Mais cette diversité entraîne également une fragmentation avec la multiplication d’outils, de formats de données complexes et hybrides (vidéo, entretiens, etc.) et de résultats associés (allant de l’intelligence artificielle à la publication de monographies). Les travaux peuvent être difficiles à partager et à relier entre eux, ce qui limite leur impact sociétal et l’émergence de potentielles collaborations transdisciplinaires. « Le lien entre données et publications est donc au cœur des enjeux de la production de connaissances en science ouverte », explique Marie Pellen, directrice de l’infrastructure de recherche OpenEdition2 et porteuse du projet COMMONS. « Nous devons mieux les lier et les structurer tout en facilitant leur partage. »

Pour cela, le consortium s’appuie sur trois infrastructures déjà engagées dans la promotion de la science ouverte en SHS. Parmi elles, l’Infrastructure de recherche OpenEdition répond aux enjeux de la communication scientifique en libre accès et la TGIR Huma-Num3 accompagne les scientifiques et projets dans leur gestion (traitements, archivage, diffusion) des données de la recherche en SHS. Ces deux structures disposent d’une infrastructure informatique au centre de calcul de l’IN2P3 à Lyon. L’infrastructure Métopes est, quant à elle, hébergée à l’Université de Caen et se consacre à l'édition structurée par le développement et le déploiement d'outils permettant la constitution, la standardisation, l'annotation et la diffusion de contenus éditoriaux en vue de leurs pleine inscription et exploitation dans des environnements de diffusion numérique.

Réunis, ces trois acteurs couvrent l’ensemble de la chaîne de production des connaissances, des données aux publications et des publications aux données. « Un de nos objectifs est le développement, sur la base de nos compétences et champs d’activités respectifs, d'un environnement numérique et d'une offre de services construits de façon transparente, à destination des chercheurs, autour des cycles de vie et d'usages des documents de la recherche », explique Dominique Roux, directeur de Métopes.

centre calcul
Une des deux salles informatiques du Centre de calcul de l’Institut de physique nucléaire et de physique des particules (CC-IN2P3).  ©Cyril FRESILLON / CC IN2P3 / CNRS Photothèque

COMMONS vise ainsi à faire progresser radicalement la dynamique de la science ouverte autour de trois axes principaux : la FAIRisation des données, les liens entre publications et données ouvertes, et la montée en compétences des communautés SHS. L’ambition est de favoriser la conversation et de proposer d’autres modalités d’administration par la preuve. « Cela repose sur des infrastructures offrant un accompagnement et des services à différents niveaux  et dès le début de la production des données pour que celles-ci aient une chance d’être pérennes, interopérables et réutilisables », décrit Olivier Baude, directeur d’Huma-Num.

Vers un système pérenne de science ouverte

Les cinq premières années du projet seront dédiées à la construction de dispositifs interopérables développés sous forme de « briques ». Elles autoriseront, sur la base d’un usage rigoureux de standards et de métadonnées, une meilleure interconnexion des plateformes, des contenus et des services. Une étape menée en interaction permanente avec les utilisateurs. Les trois infrastructures veulent ainsi disposer d’une architecture modulaire avec un socle solide agrémentée de nouveaux services ajoutés de façon itérative. Elles envisagent notamment la mise en place de systèmes d’enrichissement réciproque des données et métadonnées et de systèmes de visualisation propres aussi bien aux contenus traités qu’aux modes de consultation. Les trois infrastructures offriront, au travers d’une interface unifiée, un haut niveau d’interopérabilité entre les contenus et les données qu’elles produisent, diffusent, référencent au terme des huit ans.

Une action qui pourrait également s’étendre à d’autres infrastructures. En effet, les porteurs du projet envisagent un continuum entre l’ensemble des services disponibles en SHS au-delà du consortium. Une association avec un autre lauréat de l’ÉquipEx+ coordonné par le CNRS – le projet HALiance, dédié à la réalisation d'environnements interopérables au sein de l’archive ouverte et pluridisciplinaire HAL4 – est ainsi envisagée. « Nous tendons vers un système simple d’identification et d’authentification des utilisateurs, mais aussi dans le dépôt de publications qui pourraient être produites par Métopes ou bien publiées sur OpenEdition et exportées sur HAL en un seul clic ou bien enrichies par des jeux de données mis à disposition par Huma-Num», illustre Marie Pellen.

Les trois dernières années de COMMONS viseront à exploiter les structures mises en place et s’assurer de la pérennité des systèmes une fois le projet achevé. En ce sens, le financement de l’EquipEx+ permettra de pérenniser 13 postes sur l’ensemble des infrastructures regroupant à l’heure actuelle plus de 80 personnes dont un peu plus de 50 % d’effectifs titulaires.

Renforcer le leadership français en Europe

Au-delà de son développement national, COMMONS  jouera un rôle prépondérant au niveau européen. « Il s’agit d’un élément majeur de la contribution française au projet OPERAS5 financé par le programme H2020 et qui est une infrastructure similaire mais d’envergure européenne », explique Lionel Maurel. L’équipement tricolore est déjà engagé dans les projets de l’infrastructure à l’image du projet TRIPLE6, coordonné par Huma-Num, qui promeut la science ouverte en SHS en s’appuyant sur le moteur de recherche ISIDORE7 développé par le CNRS. De plus, OPERAS a déposé sa candidature afin d’obtenir le statut d’infrastructure européenne au cours de l’année 2021 ce qui apporterait davantage de moyens et d’impact à la promotion de la science ouverte en SHS.

  • 1. Le PIA est piloté par le Secrétariat général pour l’investissement (SGPI) et a été mis en place par l’État pour financer des investissements innovants pour augmenter le potentiel de croissance et d’emplois en France. Il intervient sur tout le cycle de vie de l’innovation et fait le lien entre la recherche publique et le monde de l’entreprise.
  • 2. USR Aix-Marseille Université / Université d’Avignon / CNRS / EHESS.
  • 3. UAR TGIR CNRS / EPCS Campus Condorcet /AMU.
  • 4. HAL est une plateforme d’archives ouvertes développée par le Centre pour la communication scientifique directe (CNRS/Inria/INRAE), destinée au dépôt et à la diffusion de travaux de recherche et de thèses, produits par les établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
  • 5. OPERAS (open access in the european research area through scolarly communication) est une infrastructure de recherche européenne pour le développement de la communication scientifique ouverte en SHS.
  • 6. TRIPLE (Targeting Researchers through Innovative Practices and Multilingual Exploration) est un projet lancé en 2019 et financé par la Commission européenne. Il doit permettre aux chercheurs de réutiliser des données en SHS et développer un réseau transdisciplinaire et multi-langue.
  • 7. ISIDORE permet la recherche et l'accès aux données numériques et numérisées de la recherche en SHS.

Liste des projets coordonnés par le CNRS ayant reçu le statut d’ÉquipEx+ du PIA3 :

  • ADD4P : Fabrication additive de verres et composants pour la photonique
  • ANVOLE : Acquisition d'un nouvel avion pour l'observation à long rayon d'action de l'environnement : un avion-laboratoire d'excellence pour l'innovation française dans la lutte contre le changement climatique et les risques naturels, l'observation spatiale de la Terre et l'aviation civile et militaire
  • COMMONS : Consortium de moyens mutualisés pour des services et données ouvertes en SHS
  • CONTINUUM : Continuité collaborative du numérique vers l'humain
  • F-CELT : Contribution française à l'instrumentation de l'Extremely Large Telescope
  • FITS : Services numériques fédérés du CNRS pour les infrastructures de recherche
  • France-Cryo-EM : Instrumentation nationale en cryo microscopie électronique
  • GAIA DATA : Infrastructure distribuée de données et services pour l'observation, la modélisation et la compréhension du système Terre, de la biodiversité et de l'environnement
  • HALiance : HAL interoperability, accessibility and network centric environment
  • MAGNIFIX : Mise au meilleur niveau global et nouvelles infrastructures françaises d'investigation aux rayons X durs
  • MuDiS4LS : Espaces numériques mutualisés pour des données FAIR en biologie-santé
  • NANOFUTUR : Investissements en nanofabrication pour les investissements en nanotechnologies du futur
  • OBS4CLIM : Système d'observation intégré pour l'atmosphère
  • PACIFICS : Initiative accélérateurs pour les futurs systèmes innovants
  • TERRA FORMA : Concevoir et tester l'observatoire intelligent des territoires à l'heure de l'Anthropocène
  • TIRREX : Infrastructure technologique pour la recherche d'excellence en robotique