Giovanni Lamanna, directeur de recherche CNRS et directeur du Laboratoire d'Annecy de physique des particules (CNRS/Université Savoie Mont Blanc), est le coordinateur du projet H2020 ESCAPE.

ESCAPE : les physiciens préparent leur science ouverte

Recherche

L'astrophysique et la physique des particules relèvent les défis de la science ouverte en Europe grâce au projet ESCAPE. Directeur de recherche CNRS, Giovanni Lamanna en est le coordinateur international : il nous fait part de sa vision pour des données ouvertes.

Comment s’organisent les efforts vers une science ouverte au niveau européen ?

Giovanni Lamanna1  : La science ouverte a trois grandes ambitions. D’abord, changer la façon dont les citoyens perçoivent la recherche et les investissements publics pour la recherche, par exemple en publiant dans des revues scientifiques gratuites et en libre accès. Ensuite, permettre à chacun de participer au processus scientifique et d’en répliquer les résultats en accédant à tout moment aux données (au sens large) de la recherche. Enfin, accélérer les découvertes et augmenter la valeur scientifique en partageant données et connaissances au sein des communautés scientifiques.

Sur ces deux derniers points, l'Union européenne a notamment lancé l'initiative "European Open Science Cloud" (EOSC). Cette plateforme en ligne unique en Europe permettra un accès universel, aux scientifiques et citoyens, aux données de recherche et facilitera leur réutilisation. Elle doit en somme devenir d’ici 2022 un environnement de recherche virtuel efficace pour la science ouverte. Mais sa mise en œuvre est un véritable défi, à la fois politique, technique et sociologique.

Photos des partenaires d'ESCAPE
Le cluster ESCAPE comprend des infrastructures de recherche de classe mondiale en astronomie et physique des particules. De gauche à droite et de haut en bas : ELT (ESO), CTA, SKA, KM3NeT, EST, HL-LHC (CERN), FAIR, JIV-ERIC, LSST, EGO-Virgo.

Votre projet ESCAPE veut rendre l’initiative EOSC plus concrète.

G.L. : Coordonné par le CNRS, ESCAPE – pour “European science cluster of astronomy & particle physics ESFRI2  research infrastructures” –  est un des cinq regroupements thématiques pour l’implémentation d’EOSC3 . Financé dans le cadre du programme H2020 de la Commission européenne à hauteur de 16 M€, ce consortium européen réunit des chercheurs et chercheuses en astronomie et en physique des particules issus de 29 institutions4  de recherche et 2 PME partenaires. Ces communautés ont une expertise reconnue en matière de grands volumes de données.

ESCAPE soutient les principes de données « FAIR » (voir encadré). Mais, en plus des octets, les données comprennent aussi les logiciels nécessaires à la production de résultats scientifiques. Avec l'engagement des projets partenaires, nous développons donc un catalogue de logiciels d'analyse open-source. Ces efforts conjoints devraient déboucher sur la création d'une infrastructure virtuelle complète d'analyse scientifique ouverte, reliée à EOSC et accessible à tous. Les scientifiques pourront archiver, en toute sécurité et sur le long terme, leurs données, logiciels, documentations et tutoriels, et accéder aux collections existantes. L’approche d’ESCAPE consiste à fournir un ensemble de fonctionnalités (voir encadré) à partir desquelles les différentes communautés pourront assembler une plateforme d'analyse adaptée à leurs besoins spécifiques. La science ne sera alors pas simplement communiquée par le biais de publications, mais par l'accès systématique à des données et plateformes logicielles permettant de reproduire et de compléter les résultats publiés.

  • 1Physicien des particules, Giovanni Lamanna est directeur de recherche CNRS et directeur du Laboratoire d'Annecy de physique des particules (CNRS/Université Savoie Mont Blanc).
  • 2Forum stratégique européen sur les infrastructures de recherche, comprenant les institutions suivantes : CTA, ELT (ESO), EST, FAIR, HL-LHC (CERN), KM3NeT et SKA en tant que partenaires d’ESCAPE.
  • 3Les thématiques des autres clusters sont les sciences humaines et sociales, la biologie numérique, la recherche environnementale et la photonique.
  • 4Des installations de l'ESFRI (telles que CTA, ELT, EST, FAIR, HL-LHC, KM3NeT et SKA) et des infrastructures et organisations de recherche paneuropéennes comme l’Organisation européenne pour la recherche nucléaire (CERN), l’Observatoire européen austral (ESO), le Joint Institute for VLBI ERIC (JIVE,  l’European Gravitational Observatory (EGO) et L'Observatoire Vera-C.-Rubin (LSST).

Des données FAIR

L'initiative EOSC soutient l'adoption d'un ensemble de principes directeurs sur les données scientifiques : celles-ci doivent être faciles à trouver, accessibles, interopérables et réutilisables (FAIR). Ces principes sont à appliquer tout au long du processus de recherche.

Où en êtes-vous aujourd’hui ?

G.L. : ESCAPE vise à concevoir un prototype d'infrastructure fédérée distribuée, appelée « lac de données », qui permettra de stocker les données dans des centres nationaux spécialisés. De cette manière, l’archivage et le traitement des données seront optimisés et les scientifiques pourront aller chercher les données dont ils ont besoin où qu’elles soient. Le défi reste la gestion de la qualité et de la sécurité des services d’accès (notamment le temps d’attente et l’authentification), des redondances5  et du stockage des données.

Aujourd’hui, l’architecture des données pilote a été choisie et ESCAPE comprend dix terminaux de stockage, dont deux en France6 , qui contiennent des données réelles issues d’expériences. Et un premier test a montré que le système fonctionne.

Pourquoi impliquer particulièrement les physiciens ?

G.L. : Les physiciens des particules sont des pionniers dans l'adaptation de services logiciels ouverts pour l'analyse, la visualisation et la gestion de données statistiques. Les astrophysiciens ont établi les standards de la publication de données via l’Observatoire virtuel, qui permet la mise en commun d’outils d’analyse et de bases de données issues de grands instruments. Surtout, l'astrophysique, l'astronomie, la physique des particules et la physique nucléaire posent toutes des questions sur la structure et l’évolution de l’Univers et des objets qui le composent. Les nouvelles installations d'ESCAPE permettront d'étendre considérablement les capacités d'observation multi-messagers7 et multi-sonde avec notamment des accélérateurs de particules de nouvelle génération8 . Ces observations produiront des volumes de données extraordinaires et des logiciels d’analyse de plus en plus complexes. Les physiciens de ces différents domaines ont choisi de développer des solutions communes à ces défis pour partager leurs avancées et profiter d’une économie d’échelle. Par exemple, des algorithmes d’intelligence artificielle et d'apprentissage automatique ont déjà été développés pour le suivi en temps réel d'alertes astrophysiques multi-messagers.

Présentation des 5 fonctionnalités d'ESCAPE

Les données ouvertes concernent-elles seulement les scientifiques ?

G.L. : Non, l’accès et l’interopérabilité des données, ainsi que la reproductibilité des résultats scientifiques associés, concernent toute la société.

D’abord, la réalisation de nos grandes infrastructures de recherche (IR) rassemble une communauté transdisciplinaire très large et met en place des coopérations avec les industries, repoussant continuellement les limites de la technologie de l'ingénierie et du calcul scientifique. Nos installations pourraient également collecter des données complémentaires générées par les composants des télescopes et détecteurs pendant leurs opérations, et informer les opérateurs et fabricants sur les performances de leurs produits dans des conditions sévères (environnementales comme d’intensité d’utilisation). Des programmes de coopération avec des PME ont également été soutenus avec succès. Le réseau européen ESCAPE ouvre ses formations aux entreprises pour les soutenir dans leur révolution numérique et dans l’exploitation des données scientifiques pour un impact également économique.

Au-delà, la question de l'efficacité énergétique est une priorité pour la société. La communauté d’ESCAPE à plus long terme peut rassembler les données nécessaires à l’optimisation de l'utilisation de l’énergie dans les IR concernées et productrices de données massives de la prochaine génération, et fournir des modèles ou des approches validés à répliquer pour minimiser les impacts environnementaux de la recherche.

Enfin, les scientifiques impliqués dans ESCAPE participent aux grandes plateformes de sciences participatives, comme Zooniverse, grâce auxquelles les citoyens peuvent contribuer aux découvertes scientifiques. Notre premier Citizen Science Workshop aura d’ailleurs lieu en ligne du 2 au 4 décembre.

Quelles sont les prochaines étapes ?

G.L. : Pour ESCAPE la Commission Europeenne a demandé un engagement formel et politique de très haut niveau, impliquant les directions de ses IR partenaires, mais ce sont les chercheurs et les chercheuses qui doivent par ESCAPE définir les principales fonctionnalités d'EOSC en fonction de leurs besoins. Mais l’implication des scientifiques dans la science ouverte ne peut se faire que s'ils en reçoivent une reconnaissance. ESCAPE a donc prévu des projets scientifiques de test (TSP) fédérant plusieurs membres de l'ESFRI, pour promouvoir et démontrer l'impact de l'analyse de données en science ouverte. Conçus comme des bancs de validation des services prototypes développés par ESCAPE, ces projets produiront des résultats innovants et des publications. Grâce à un financement complémentaire de la Commission Européenne, deux TSP – sur la matière noire et les phénomènes de très haute énergie dans l’Univers – ont déjà été sélectionnés. Ils suscitent l’adhésion des scientifiques et comptent aujourd’hui environ 1000 participants. Nous développerons pour eux et avec eux des solutions partagées pour interroger les données et évoluer dans les connaissances avec une approche partagée et transversale. Au centre du prochain programme cadre Horizon Europe9 , la science ouverte et la révolution numérique ont maintenant tous les éléments pour prendre de l’essor.

  • 5Pour pallier les éventuelles défaillances, les données mais aussi les logiciels et systèmes de réseaux doivent exister en plusieurs exemplaires indépendants.
  • 6Les centres de données INFN en Italie, DESY et GSI en Allemagne, SURF-SARA au Pays-Bas, le CERN à Genève, l’IFAE-PIC en Espagne, le CC-IN2P3 de Lyon et MUST (LAPP) à Annecy pour la France.
  • 7Spectre électromagnétique jusqu'aux rayons gamma de haute énergie, neutrinos, ondes gravitationnelles, etc.
  • 8L'accélérateur internationale FAIR en cours de construction à Darmstadt, en Allemagne, et le projet de Grand collisionneur de hadrons à haute luminosité (LHC à haute luminosité) en cours de préparation au CERN de Genève, en Suisse.
  • 9Successeur du programme Horizon 2020, ce programme-cadre de l'Union européenne pour la recherche et l'innovation couvre la période allant de 2021 à 2027.