Huma-Num : « faire des données des SHS un bien commun »

Recherche

En à peine une décennie, l’infrastructure de recherche Huma-NumIR* est parvenue à fédérer les communautés de recherche en sciences humaines et sociales autour de la science ouverte et à les intégrer dans l’espace européen de la recherche. Elle fêtait ces réalisations les 25 et 26 septembre 2023 au Campus Condorcet.

« Huma-Num est bien plus qu’une infrastructure de recherche : c’est un vecteur de progrès vers l’avenir de la recherche en sciences humaines et sociales ». Les mots de Johanna Etner, cheffe du secteur Sciences de l'Homme et de la Société au ministère de l’Enseignement supérieur et de la Recherche (MESR), donnent le ton du dixième anniversaire de l’infrastructure de recherche Huma-NumIR*1 , célébré sur le Campus Condorcet. Alain Schuhl, directeur général délégué à la science du CNRS, abonde dans son sens : « Huma-Num est l’un des dispositifs français les plus avancés en matière de science ouverte, tous champs disciplinaires confondus ».

Pourtant, comme le note Antoine Petit, président-directeur général du CNRS, « faire entrer les infrastructures de recherche dans d’autres disciplines que la physique n’était pas gagné d’avance ». En dix ans, Huma-NumIR*a ainsi construit une position centrale au sein des sciences humaines et sociales (SHS), tant au niveau national qu’européen. Née en 2013 de la fusion entre le très grand équipement (TGE) Adonis, tourné vers les services informatiques, et l’infrastructure de recherche Corpus, constituée de consortiums disciplinaires en SHS, l’infrastructure de recherche étoile2 Huma-NumIR* a accompagné, dès l’origine, « la rencontre entre des communautés de recherche et les aspects technologiques » en leur proposant des outils numériques adaptés à leurs besoins, souligne son directeur Olivier Baude. Depuis sa création, l’infrastructure a par ailleurs renouvelé et étendu les services qu’elle proposait pour répondre au mieux aux besoins des communautés SHS. Pour Marie Gaille, directrice de CNRS Sciences humaines et sociales, « si Huma-Num était tout d’abord orientée vers les humanités, elle a désormais un usage beaucoup plus large grâce au développement d’outils qui servent toutes les communautés SHS ».

Des consortiums pour fédérer les SHS

Ces évolutions ont été nourries par l’activité de groupes scientifiques, les Consortiums-HN, soutenus par Huma-Num. Cette organisation originale réunit des personnels de métiers variés autour de thématiques et d’objets scientifiques communs articulés autour des pratiques numériques, afin de produire au sein d’un programme d’actions sur quatre ans des ressources comme des guides de bonne pratique, des outils, des formations, etc. Une quinzaine de consortiums ont été créés depuis 2013 et neuf sont actuellement en activité, aussi variés qu’ARIANE porté par des spécialistes du texte, MASA étudiant les pratiques en archéologie ou encore MUSICA2 sur la musicologie. Ces Consortiums-HN jouent, pour Marie Gaille, un « rôle fédérateur au sein des SHS », car ils permettent d’« agréger des problématiques de recherche transverses » – comme les pratiques d’archivage à l’ère du numérique, d’annotation et d’indexation de corpus écrits ou vidéos ou encore de modélisation 3D – au sein des communautés de sciences humaines et sociales.

Par ailleurs, l’équipe d’Huma-NumIR*, constituée d’une vingtaine de personnes, développe des services spécifiques pour les données en SHS dans le contexte de la science ouverte. Parmi eux, ISIDORE, lancé en 2010 à l’initiative du CNRS, est un assistant scientifique mêlant moteur de recherche et réseau social académique, facilitant en même temps la constitution d’un réseau et d’une veille scientifique. Ce double système fait d’ISIDORE « un objet unique au niveau international » aux yeux de Stéphane Pouyllau, directeur adjoint d’Huma-NumIR* et responsable du développement d’ISIDORE. En parallèle, les projets de recherche en SHS peuvent déposer leurs jeux de données dans l’entrepôt de recherche NAKALA, créé en 2014. « Stocker et conserver des données brutes n’est cependant pas suffisant », considère Hélène Jouguet, responsable du pôle Données et coordination de l’accompagnement des utilisateurs. Ainsi, elle conseille les projets de recherche afin d’obtenir des données de qualité par l’enrichissement des descriptions ainsi que l’emploi de formats pérennes.

Compte tenu du succès (voir chiffres clés) de ses outils auprès des communautés SHS, Huma-NumIR* s’est vue reconnaître en 2022 par le MESR comme l’un des six centres de référence thématiques en SHS – l’autre étant l’infrastructure de recherche PROGEDO – de l’écosystème Recherche Data Gouv3 . Cette reconnaissance signifie, pour Marie Gaille, que « les SHS font partie des domaines où science ouverte et pratique de la recherche ont été articulées de manière très précoce, en partie grâce à Huma-Num qui a préparé nos communautés aux problématiques des données de la recherche, de l’ouverture des codes et des protocoles d’enquête ».

  • 1CNRS/Aix-Marseille Université/Campus Condorcet.
  • 2Les IR* (appelées TGIR – très grande infrastructures de recherche – dans les précédentes éditions de la feuille de route nationale des infrastructures de recherche) sont des infrastructures qui, bien qu’étant sous la responsabilité scientifique des opérateurs de recherche, relèvent d’une politique nationale et font l’objet d’un fléchage budgétaire du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation.
    https://www.enseignementsup-recherche.gouv.fr/fr/la-strategie-nationale-des-infrastructures-de-recherche-46112
  • 3Lancé par le MESR en juillet 2022, Recherche Data Gouv est un écosystème au service du partage et de l’ouverture des données de recherche, qui a été pensé pour soutenir les équipes de recherche dans leur travail de structuration des données pour les rendre Faciles à trouver, Accessibles, Interopérables, Réutilisables, c’est-à-dire conformes aux principes « FAIR ».
6 millions de documents en 500 langues pour ISIDORE
800 000 visiteurs internationaux par an pour ISIDORE
600 000 jeux de données pour NAKALA, dont 70 % d’images
2 000 déposants pour NAKALA

Promouvoir la science ouverte en SHS en Europe

Cet effort de coordination des SHS s’est également porté en direction de l’Europe de la recherche. En effet, Huma-NumIR* a pour mission historique de porter la participation de la France dans l’ERIC DARIAH (voir encadré). Huma-NumIR* joue, selon Nicolas Larrousse, directeur adjoint de l’unité et coordinateur national de DARIAH depuis dix ans, un « rôle de facilitatrice entre le national et l’international ». En lien avec les infrastructures nationales comme OpenEdition et le Centre pour la communication scientifique directe (CCSD), Huma-Num valorise ainsi les services nationaux. Par ailleurs, Huma-Num soutient l’intégration de différentes communautés SHS françaises — notamment via ses consortiums et en collaboration avec le réseau national des Maisons des sciences de l’Homme — aux activités européennes, par exemple les working groups1 rattachés à DARIAH. En parallèle, l’infrastructure met en pratique, pour Nicolas Larrousse, une véritable « diplomatie scientifique » à l’échelle du continent ; ainsi, sa participation à cinq projets européens liés à DARIAH « a permis de nourrir la construction d’infrastructures européennes et de nouer des liens avec nos partenaires au sein de l’Union ».

Par-delà son rôle de représentante française dans la communauté SHS européenne, Huma-NumIR* apporte une solide expertise technique à l’espace européen de la recherche. Pour Marie Gaille, Huma-NumIR* est naturellement vouée à « construire des briques de recherche pour la communauté SHS française au sein de l’European Open Science Cloud ». Parmi ces briques figure notamment le SSH Open Market Place, développé dans le cadre du projet H2020 SSHOC dans lequel Huma-NumIR* était fortement impliquée. Cet outil permet de valoriser les services proposés par les pays membres de DARIAH avec, en particulier, la possibilité de les présenter sous la forme d’un flux montrant les outils et ressources appropriés à la réalisation de chaque étape d’un processus d’un traitement sur des données numériques des SHS. Ce rôle moteur de la structure au niveau européen fait ainsi dire à Antoine Petit qu’« Huma-Num a développé des partenariats clefs pour le CNRS ».

  • 1Les working groups sont des activités communes organisées au sein de DARIAH. Ils sont auto-organisés et évalués par un comité. Ces working groups, soutenus financièrement par DARIAH, ont un objectif précis : fournir des ressources à la communauté, qui peuvent être de nature scientifique, technique, éditoriale ou organisationnelle. Cela signifie qu'ils contribuent à la construction et à l'extension des réseaux d’expertise de l'infrastructure de DARIAH.

L’ERIC DARIAH

À la différence des projets européens de court terme, comme les ERC, un consortium pour une infrastructure européenne de recherche (ERIC) est une structure internationale portée et financée par les États membres de l’Union européenne sur le long terme – une vingtaine d’années en général. Une telle structure permet de réaliser une mutualisation au niveau européen et également de prendre en charge les productions des projets européens à leur clôture.

L’ERIC Digital Research Infrastructure for the Arts and Humanities (DARIAH) a, pour sa part, été créé en août 2014, soutenu notamment par la France, pays où se situe le siège social de DARIAH, hébergé dans les locaux d’Huma-NumIR*. C’est un ERIC généraliste et interdisciplinaire destiné à soutenir la recherche en SHS et dans les domaines du patrimoine. DARIAH est bâti sur un réseau de personnes, d'expertises, de connaissances, de contenus, de méthodes, d'outils et de technologies provenant de 22 pays membres.

Huma-NumIR* a été moteur dans la création de cet ERIC et en coordonne la participation française, qui s’appuie actuellement sur Huma-NumIR* (pour les services d’hébergement, NAKALA et ISIDORE), le CCSD (HAL, SciencesConf et Episcience) et OpenEdition (Blogs Hypothèses, Calenda, etc.) mais qui a vocation à s’étendre à d’autres partenaires nationaux de Huma-NumIR* comme la Bibliothèque nationale de France.

Au terme de cette journée anniversaire, tous les regards se tournent, non vers le passé, mais vers l'avenir. « Que sera l’Huma-Num de demain ? », interroge la dernière table ronde. La place de l’intelligence artificielle domine celle-ci, puisqu’on la retrouve autant dans ISIDORE 2030, qui intègrera dorénavant de l’intelligence artificielle générative, que dans NAKALA pour en améliorer la qualité des données. In fine, toutes ces avancées vont dans le même sens, estime Olivier Baude : « faire des données un bien commun ».