Accueil du site > Les défis > MASTODONS




Rechercher

Sur ce site

Sur le Web du CNRS


Grandes masses de données scientifiques - MASTODONS

Année de démarrage : 2012

Contexte :
Nos capacités de production, d’acquisition et d’accès aux données dépassent largement nos capacités de traitement, d’analyse et d’archivage. De nombreux domaines scientifiques (ex : cartographie du génome, observatoire virtuel en astronomie, simulation en physique et énergie), économiques (ex : e-commerce, systèmes décisionnels), ou sociétaux (ex : réseaux sociaux, bibliothèques numériques, distribution de contenus multimédia) produisent et consomment des volumes de données considérables. Le CNRS, à travers ses unités de recherche et ses grands instruments, capitalise plusieurs centaines, voire milliers, de bases de données et de corpus d’informations dont les volumes croissent de façon exponentielle.

Objectifs :
Le but est d’identifier et de soutenir des actions de recherche dont les résultats ne pourraient être obtenus sans une fertilisation croisée des disciplines et sans une synergie effective entre chercheurs. Ces actions de recherche doivent couvrir aussi bien les verrous scientifiques posés par l’utilisation à grande échelle des données (sémantique, stockage, recherche, visualisation, …) que l’impact sociétal qu’induisent les technologies proposées (protection de la vie privée, préservation de la connaissance, …).

Les projets sélectionnés couvrent les axes de recherche suivants :
1. Stockage, indexation et accès aux données (en particulier dans le Cloud),
2. Extraction de connaissances, apprentissage et la visualisation de grandes masses de données,
3. Qualité des données, confidentialité et sécurité des données.
4. Problèmes de propriété, de droit d’usage, droit à l’oubli.
5. Préservation/archivage des données pour les générations futures.

Quel que soit l’axe de recherche couvert, les verrous principaux concernent essentiellement le calcul intensif sur des grands volumes de données, le parallélisme dirigé par les données et la sémantique des données.

Au lancement, le défi est uniquement porté par le CNRS. A l’issue de la séléction des projets et en particulier durant le colloque de restitution, diverses manifestations d’intérêt ont été exprimées pour participer à ce défi. Ainsi, la société ATOS est intéressée par la question de l’archivage et de préservation pérenne et souhaiterait s’associer à un ou deux projets du défi. Par ailleurs, des contacts ont été pris avec l’INSERM et l’Institut Pasteur qui sont des partenaires potentiels pour tout ce qui concerne les données biomédicales. Des contacts ont été également pris avec l’INSEE et son unité de recherche, CRESTA.

Pour consulter la liste des projets soutenus :

PDF - 185.6 ko