Une recherche sur 40 millions d’objets du patrimoine

Recherche

Le 10 mars, le CNRS et la Bibliothèque nationale de France (BnF) renouvellent une convention cadre qui fait suite à un partenariat initié en 1978. À l’heure du web et du numérique, de nouvelles opportunités de recherche se profilent.

Comptant parmi les plus grandes bibliothèques du monde avec la Library of Congress1 et la British Library2 , la BnF regroupe une collection de plus de 40 millions de documents et d’œuvres comprenant, outre les livres et les périodiques imprimés, des manuscrits, photographies, cartes, estampes, monnaies, médailles, décors et costumes de théâtre, partitions, presse écrite, documents sonores et audiovisuels, jeux vidéo et davantage encore… Avec 10 000 manuscrits enluminés de l'époque médiévale, elle est notamment la première bibliothèque mondiale dans ce domaine. « Les collections de la BnF sont d’une extrême diversité et d’une rare profondeur historique car elles sont liées à l’histoire des rois de France depuis le XIVème siècle et à celles de leurs collections privées, mais aussi parce qu’elles sont nourries par le dépôt légal, depuis sa création en 1537 par François 1er, » explique Laurence Engel, présidente de la BnF.

Collecter, cataloguer, conserver
De par sa mission de collecte, de catalogage et de conservation des collections, la bibliothèque est ancrée dans la recherche. Elle lui a d'ailleurs été exclusivement dédiée avant de s'ouvrir au grand public en 1994. Mais son lien avec la science va au-delà des services qu’elle lui rend. « La bibliothèque est elle-même un établissement de recherche. Les personnels scientifiques sont bien sûr nombreux, mais en leur sein, 200 sont engagés expressément dans un travail de recherche.  La BnF dispose même d’un Laboratoire scientifique et technique », rappelle Laurence Engel. À la BnF, la recherche porte sur de nombreux domaines, qui reflètent la diversité des collections ; mais on peut à grands traits distinguer l'histoire et l’analyse des collections de la BnF d’une part, et les sciences du patrimoine et des bibliothèques d’autre part. Une entreprise à laquelle le CNRS s’est joint dès les prémices, par le biais d’une première convention-cadre signée en 1978.

d
Laurence Engel, présidente de la BnF © Léa Crespi

42 ans de partenariat
Au fil du temps, plusieurs collaborations que l’on peut qualifier d’historiques ont été menées à bien. « Cette relation très ancienne couvre des champs très larges. Le CNRS est une institution transversale, pluridisciplinaire, qui nous permet de couvrir toutes nos collections. »
Cette coopération a concrètement donné naissance à de nombreux programmes de recherche menés en lien étroit avec des laboratoires du CNRS, mais également à la cotutelle d’unités mixtes de recherche (UMR). L’Institut de recherche en musicologie3 , créé en 1966 (voir encadré), sera le premier à voir le jour, suivi plus récemment par le 
Laboratoire ligérien de linguistique4 (voir encadré) en 2012. Tous deux sont hébergés au sein de la BnF.
« Parmi les plus anciens projets communs on peut citer la collaboration avec l’Institut d’histoire moderne et contemporaine5 et la BnF pour la rédaction de la Bibliographie annuelle de l’histoire de France, (voir encadré) à partir des collections du dépôt légal. Dans le cadre de cette collaboration, nos ingénieurs et techniciens sont accueillis de façon permanente à la BnF », rapporte François-Joseph Ruggiu, directeur de l’Institut des sciences humaines et sociales du CNRS.
Au-delà des deux grands domaines scientifiques de la BnF – les sciences humaines et sociales et les sciences et technologies de l’information et de la communication — d’autres sciences spécifiques dites « dures » sont mobilisées. En effet, pour trouver un remède aux altérations biologiques qui menacent les collections de livres et de documents, la BnF fait front commun avec les chimistes, physiciens, biologistes du Centre de recherche sur la conservation (CRC)6
. Ce partenariat remonte aux années 1950 avec le laboratoire de cryptogamie du Muséum national d’histoire naturelle, ancêtre du CRC. La coopération signée en 1975 avec l’Institut de recherche sur les archéomatériaux (IRAMAT)7 compte aussi au nombre des collaborations de longue date.

d
Manipulation d'un manuscrit médiéval en vue de sa numérisation. Cette mission s'effectue dans le cadre des campagnes photographiques de l'Institut de recherche et d'histoire des textes (IRHT). © Claude DELHAYE CNRS Photothèque

De nouveaux horizons
Si les sciences humaines et sociales demeurent le champ permanent du partenariat à travers des disciplines telles que l’archéologie, l’histoire, les sciences politiques, la littérature, etc., la nouvelle convention élargit les domaines de collaboration en SHS. « Nos collections se sont étendues bien au-delà des documents traditionnels, livres ou manuscrits, singulièrement depuis la signature de la dernière convention en 2015. Au CNRS, les problématiques de recherche ont également évolué », souligne la présidente de la BnF. Aujourd’hui, il est question de transport de savoir, de cartographie, d’histoire de la vidéo et bien plus encore en terme de recherche sur les collections. « Nous avons intégré ces nouveaux champs dans la nouvelle convention. »

Le Data Lab
Le travail sur les collections elles-mêmes, et notamment la question des collections numériques est un sujet incontournable. En effet, l’augmentation de ces collections (numérisation, archives de l’internet, documents numériques natifs, catalogues enrichis grâce au web sémantique8
…) soulève des problématiques nouvelles d’exploitation par les chercheurs et fait émerger de nouveaux usages. « Il nous faut trouver de nouvelles manières de conserver, traiter et mettre toutes ces données aux services des autres,» note Laurence Engel. L’intelligence artificielle et la science des données sont désormais essentielles pour aborder des corpus documentaires numériques de masse. « Il s’agit à la fois de développer des outils permettant de mieux travailler sur les collections numériques ou numérisées ; et d’exploiter, comme des collections, les données associées aux documents. »
C’est pour répondre à ces enjeux que la BnF doit créer un nouveau service de fourniture et d’exploration des données à destination de la recherche : le « BnF Data Lab ». Ce dernier fait suite à un programme de recherche de quatre ans (2016-2019) et ouvrira ses portes au sein de la BnF à l’automne 2020.

d
Le « BnF Data Lab » sera situé dans une salle de la bibliothèque de recherche (Rez-de-jardin) du site François-Mitterrand © Thesupermat

Dédié aux humanités numériques, ce service permettra d’exploiter les très vastes collections de la BnF et de mettre à disposition des corpus nativement numériques ou numérisés, avec des outils permettant la fouille de données. « Cette réflexion de la BnF répond au souhait du CNRS de développer un dispositif autour de la fouille de données massives, notamment sur les corpus littéraires ou historiques de très grande dimension. Cela se traduit par la mise en place d’une collaboration entre la BnF et la Très Grande Infrastructure de Recherche Huma-Num9 , avec un poste dédié mis en place par le CNRS,» souligne François-Joseph Ruggiu

Autant de programmes qui permettront d’étudier et de mettre les 40 millions de documents que regroupent les collections de la bibliothèque à la disposition des scientifiques du monde entier.

  • 1Bibliothèque nationale américaine.
  • 2Bibliothèque nationale britannique.
  • 3CNRS / Sorbonne Université / BnF /Ministère de la Culture.
  • 4CNRS / Université de Tours / Université d’Orléans.
  • 5CNRS / Université Paris 1 Panthéon-Sorbonne / ENS Paris.
  • 6 CNRS / MNHN / Ministère de la Culture.
  • 7CNRS / Université de technologie de Belfort Montbéliard / Université d’Orléans / Université Bordeaux Montaigne.
  • 8Web intelligent basé sur le partage intelligent des données, en généralisant un système de métadonnées.
  • 9Huma-Num vise à faciliter le tournant numérique de la recherche en sciences humaines et sociales. Elle met à disposition un ensemble de services pour le stockage, le traitement, l'exposition, le signalement, la diffusion et la conservation sur le long terme des données numériques de la recherche en sciences humaines et sociales. Cette TGIR est mise en œuvre par le Ministère de l'Enseignement supérieur et de la Recherche et portée par le Centre national de la recherche scientifique, Aix-Marseille Université et le Campus Condorcet.

La coopération entre le CNRS et la BnF

Depuis 1978, la Bibliothèque Nationale (devenue BnF en 1994) et le CNRS ont noué un partenariat de recherche sous la forme d’une convention cadre régulièrement renouvelée.

Ce partenariat se concrétise par la cotutelle de laboratoires :

  • L’Institut de recherche en musicologie1 (créé en 1966) étudie notamment l’enseignement musical en France au XIXe siècle, la musique électroacoustique, l’histoire des collections.
  • Le Laboratoire ligérien de linguistique2 (créé en 2012) centre ses recherches sur la collecte et le traitement de corpus oraux et de documents sonores, en lien avec différents laboratoires, tant en France qu'à l'étranger.
     

Il se traduit aussi par des conventions d’application avec des laboratoires du CNRS particulièrement concernés par cette coopération scientifique :

  • L’Institut des textes et manuscrits modernes3 (ITEM) se consacre à la recherche fondamentale sur les manuscrits médiévaux et les imprimés anciens. L’histoire des textes écrits dans les principales langues de culture du pourtour méditerranéen, latin, langues romanes, hébreu, grec, copte, syriaque, arabe, y est traitée dans tous ses aspects : supports matériels de l’écrit, écriture et décoration, contenu textuel, iconographie, diffusion et réception.

Exemple de programme mené conjointement avec la BnF : Manuscrits en caractères hébreux conservés dans les bibliothèques de France

  • L’Institut de recherche et d’histoire des textes4 (IRHT) se consacre à l’étude de la genèse des œuvres de l’esprit à partir des traces empiriques laissées au cours du processus créateur.

Exemple de programme mené conjointement avec la BnF : Editions des cahiers de Marcel Proust

  • Le Centre de recherche sur la conservation5 (CRC) regroupe des chimistes, physiciens, biologistes, historiens de l’art ou historiens des sciences et des techniques. Leurs travaux s’intéressent aux objets de musée, aux archives et bibliothèques, mais également aux monuments historiques, et visent en particulier la connaissance des matériaux du patrimoine et l’étude de leurs processus d’altération, ainsi que le développement de méthodes de conservation préventive et curative.

Exemple de programme mené conjointement avec la BnF : CoMPresSil Conservation matérielle du papier de presse par les polysiloxanes.

  • L’Institut de recherche sur les archéomatériaux6 (IRAMAT) développe des techniques non-destructives de caractérisation des archéomatériaux et applique ces méthodes pour répondre à des problématiques historiques et archéologiques.

Exemple de programme de recherche mené conjointement avec la BnF : recherche numismatique

  • L’Institut d’histoire moderne et contemporaine7 étudie dans le temps long les processus historiques qui ont construit le monde actuel depuis le XVe siècle. Les périodes moderne et contemporaine y sont envisagées comme un cycle historique d’ensemble, celui de la modernité, caractérisé en particulier par l’intensification des circulations et des échanges et un élargissement constant des espaces reliés, en Europe et hors d’Europe.

Exemple de programme de recherche mené avec la BnF : Bibliographie annuelle de l’histoire de France

  • 1CNRS / Sorbonne Université / BnF / Ministère de la Culture.
  • 2 CNRS / Université de Tours / Université d’Orléans.
  • 3 CNRS / ENS Paris.
  • 4CNRS.
  • 5 CNRS / MNHN / Ministère de la Culture.
  • 6CNRS / Université de technologie de Belfort Montbéliard / Université d’Orléans / Université Bordeaux Montaigne.
  • 7CNRS / Université Paris 1 Panthéon-Sorbonne / ENS Paris.