Page 22

JDC269

w 22 | cnrsI LE JOUrnAL L’enquête La révoLUtion dU big daTa dansLes sciences hUmaines et sociaLes 01 « Les grandes masses de données explique-t-il.Si ces dernières scientifique à l’INSHS.Qu’est-ce ont révolutionné le travail des n’ont pas été récoltées par le que cela signifie d’avoir accès à spécialistes des sciences chercheur lui-même, comment plus de connaissances qu’un esprit humaines et sociales. » Bertrand savoir ce qu’elles ont subi avant humain ne peut en concevoir? Jouve, mathématicien et directeur d’être intégrées à la base Quelles conséquences cette adjoint scientifique à l’Institut de données? » Pour Sihem exhaustivité qu’on ne contrôle des sciences humaines et sociales Amer-Yahia, il s’agit là pas a-t-elle sur notre rapport du CNRS (INSHS), voit dans le d’un gros écueil duBig Data. au savoir? » Se posent également e Big Data une belle opportunité « Le traitement des données les questions de la propriété UR t pour ses pairs. « Grâce aux bases brutes constitue souvent une des données, des droits INPIC de données en ligne, nous avons boîte noire à laquelle personne d’utilisation, du droit à l’oubli, la P k/ désormais aisément accès à une n’a vraiment accès. Or on sait déjà de l’éthique… Autant de sujets C Sto somme de connaissances qu’il que certaines manipulations auxquels les chercheurs en  y nous fallait trouver dans les assez courantes dans ce domaine sciences humaines et sociales R Galle bibliothèques souvent peuvent supprimer une grosse doivent s’atteler, en coopération  © 01 L’ère numérique a facilité pour les chercheurs l’accès à dispersées… Et les enquêtes sur partie des informations. » avec d’autres disciplines, l’information, autrefois dispersée dans les bibliothèques. Internet ont facilité le travail, L’avènement des grandes pour le bénéfice des citoyens des sociologues par exemple. » masses de données et du et, peut-être, contre la mainmise Mais son enthousiasme ne lui fait tout-numérique soulève d’autres des intérêts privés. Christine Collet. Elles sont partout et sont pas oublier les difficultés interrogations moins techniques. cOntActs : impliqueBig DataLe«auxquelles sont confrontés les élaborées, commercialisées et consommées utilisateurs. « Le problème réside nécessairement des réflexions bertrandjouve comme n’importe quel produit manufac- le plus souvent dans le traitement épistémologiques,note Sandra > andra Laugierertrand.jouve@cnrs-dir.frbs turé. » Ces grandes masses de données des informations brutes, Laugier, directrice adjointe > sandra.laugier@cnrs-dir.fr sont devenues un tel enjeu économique, industriel et scientifique que les gouverne- ments et les entreprises investissent massi- les Investissements d’avenir se sont aussi Asch, chargé de mission pour les mathé- vement dans le domaine. Aux États-Unis, emparés du sujet. Un programme de matiques et le calcul numérique à la le président Barack Obama a dévoilé en 25 millions d’euros est consacré aux tech- Direction générale pour la recherche et mars un planBig Data allouant 200 mil- nologies d’exploitation des très grands l’innovation du ministère de l’Enseigne- lions de dollars à la recherche dans ce do- volumes de données. ment supérieur et de la Recherche. Face à maine (« Big Data Research and ce constat, la Mission pour l’interdiscipli- Development Initiative »). De son côté, Un défiPoUrLes scientifiqUes narité du CNRS a lancé cette année le défi l’Europe a inscrit la gestion des contenus « LeBig Dataconstitue un défi scientifique Mastodons (lire encadré p. 21). L’idée est numériques dans ses priorités pour la fin considérable qui nécessite des travaux de soutenir des projets interdisciplinaires du 7e programme-cadre de recherche et de aussi bien en ingénierie que dans les afin d’identifier où sont les verrous dans développement technologique. En France, sciences fondamentales », explique Mark la gestion des grandes masses de données L’écheLLe des octets Unité Une page Un morceau Un film six.ltab millions Une pile Toutes les La totalité La NSA se dote de mesure de texte de musique de two.ltab heures de livres de DVD de la informations des données pour two.ltabzero.ltabone.ltabthree.ltab de base three.ltabzero.ltab ko five.ltab Mo one.ltab Go la moitié de la tour jusqu’à two.ltabzero.ltabzero.ltabthree.ltab enregistrées d’undatacenterde three.ltabzero.ltabzero.ltab zero.ltabzero.ltabzero.ltab m²en two.ltabzero.ltabone.ltabone.ltabproduiteshauteur(presque one.ltab o du catalogue Montparnasse de la BNF) five.ltab Eo one.ltab,eight.ltab Zo one.ltab Yo one.ltab Po one.ltab To Octet Kilo–octet Mégaoctet Gigaoctet Téraoctet Pétaoctet Exaoctet Zettaoctet Yottaoctet /CNRS ko Mo Go To Po Eo Zo Yo GIF one.ltabzero.ltabzero.ltabzero.ltab octects one.ltabzero.ltabzero.ltabzero.ltab ko one.ltabzero.ltabzero.ltabzero.ltab Mo one.ltabzero.ltabzero.ltabzero.ltab Go one.ltabzero.ltabzero.ltabzero.ltab To one.ltabzero.ltabzero.ltabzero.ltab Po one.ltabzero.ltabzero.ltabzero.ltab Eo one.ltabzero.ltabzero.ltabzero.ltab Zo ata D ©


JDC269
To see the actual publication please follow the link above