n° 269I nOvEmbrE-DécEmbrE 2012 L’enquête | 25 w Le caLcUL intensif àLivre oUvert 09 Dans le domaine du calcul et industrielles. De son côté, e (« Hight performance le calcul intensif (Cocin) du Photothèqle Comité d’orientation pourU haute performance ou HPC computing »), les États-Unis CNRS a publié, en 2012, restent le leader incontesté. un livre blanc dressant une /CNRS Sur les 500 supercalculateurs cartographie des pratiques N llo les plus puissants existant de l’institution scientifique éSI C m, . mb NGkI , sur la planète en 2012, ils dans ce domaine.« Au CNRS . ING /U C RD l en concentrent en effet 252, le calcul intensif concerne © D a o o DD - soit près de la moitié de la plus de 2500 chercheurs et implantés sur le territoire 09 Le supercalculateur I R. /Go t, , puissance réelle disponible, enseignants-chercheurs, ce devra être couplée curie est capable R R te a be S IS a U qui atteint désormais 120 qui en fait l’une des plus à une urbanisation des d’effectuer N h me , C R S C jusqu’à 2 millions le a b pétaflops (PFlops)1. importantes communautés infrastructures de calcul et de milliards IND h, o, IC h La France regroupe, elle, 22 pluridisciplinaires en de données, intégrant à d’opérations C lov R S . SI de ces 500 supercalculateurs, Europe », souligne Michel la fois HPC, grilles de calcul, à la seconde et de : o N I . pour une puissance totale Daydé, directeur du Cocin cloud et grands centres de stocker l’équivalent ez, , I N R al de 6,4 PFlops. L’Hexagone et coauteur de ce rapport. données »,analyse Michel de 7600 ans de o a S U S Paw . se classe ainsi au 6e rang Or les besoins grandissants Daydé. Une stratégie que fichiers de musique. ; S. , RD R , mondial en termes de cette communauté en le Cocin préconise de mettre Il est situé ke a DD C . e de puissance dédiée au calcul matière de HPC ne sont pas en place tant à l’échelon àbruyères-le-châtel N /Go , CS I R intensif. Au sein du CNRS, le toujours satisfaits par les national qu’européen. dans l’Essonne. a . aka S m a N t © Centre de calcul de l’IN2P3 allocations d’heures, que ce 1. superordinateur est un acteur majeur du soit sur les centres nationaux «pétaflopique»estcapablede calcul intensif via le ou via sur les appels à projets réaliserunmilliondemilliards flottantevirguleend’opérations développement de grilles européens.« Pour répondre parseconde. informatiques destinées aux à cette demande, la poursuite cOntAct: expériences du LHC ainsi qu’à de la montée en puissance micheldaydé des applications biomédicales des supercalculateurs > michel.dayde@cnrs-dir.fr 04La simulation entité décentralisée qu’est le web ne relève En effet, il s’agit de faire converger deux de l’Univers dans le pas d’un simple problème d’amélioration types de données : des données brutes cadre du projet Deus technologique! » (images, résultats de traitements…) et des générera plus de 150 Po de données Ces dernières années, un domaine données dites « symboliques », provenant 05L’étude du climat scientifique a vu ses pratiques complè- de la description des premières : contexte (ici, l’humidité tement bouleversées par les avancées d’acquisition des données brutes, carac- atmosphérique technologiques : la recherche biomédi- téristiques anatomiques ou pathologiques le 17 juin 1993) nécessite de cale. « Le volume d’information prove- extraites d’une image, etc. « L’un des prin- manipuler nant de l’imagerie biomédicale s’est cipaux défis du projet Credible consiste à des masses de considérablement accru, avec le pas- mettre au point une représentation sé- données colossales qui devraient sage au tout-numérique, au cours des mantique de ces données symboliques atteindre le dix dernières années », témoigne Johan dans le but de leur attribuer une significa- yettaoctet en 2020. Montagnat, directeur de recherche tion scientifique», poursuit le chercheur. 06 représentation CNRS au laboratoire Informatique, si- Ainsi harmonisées, ces bases de données, des maladies manière à pouvoir accéder plus simple- de 7,2 millions gnaux systèmes de Sophia Antipolis d’ordinaire très hétérogènes, pourraient ment à la connaissance », résume Marie- d’Américains (I3S)2 et coordonnateur, dans le cadre alors être regroupées dans une même Christine Rousset. et de leurs relations de Mastodons, du projet Credible, des- étude clinique, d’envergure nationale entre elles, issue tiné à fédérer les données et les connais- voire internationale. L’analyse, à une telle Un webPLUsPerformant Institute sances en imagerie biomédicale épar- échelle, des ressources biomédicales four-assachussetsmdu Cette évolution est déjà en marche au oftechnology. pillées au sein de plusieurs établissements nirait aux chercheurs un moyen inédit travers du W3C, le consortium interna- 07cette carte, hospitaliers sur le territoire français. pour répondre aux défis de santé aux- tional qui veille au respect des normes réalisée par Olivier quels ils se heurtent encore aujourd’hui.eauchesne,b sur le Web. Certains embryons de ce représente des fédérerLes données Pour éviter la noyade dans l’océan Web, qualifié de « sémantique » car il collaborations « La stratégie consistant à centraliser des numérique des grandes masses de don- permet aux machines de comprendre la scientifiques entre masses de données médicales sera tôt ou nées, il faut recourir à des experts : les signification de l’information circulant 2005 et 2009. tard limitée par les capacités de stockage spécialistes en fouille de données. Partant sur la Toile, existent déjà. Mais, faire du disponible,justifie Johan Montagnat.De des bases de données à l’état brut, ils sont Web sémantique un modèle universel plus, la multiplication des instruments chargés de faire remonter à la surface les reste une tâche ardue. « Greffer des algo- d’acquisition de données au sein des éta- connaissances qu’elles renferment. « Ce rithmes d’interrogation sur une base de blissements hospitaliers rend inévitable la travail algorithmiquement difficile revient données centralisée est une chose, com- distribution de celles-ci sur différents sites à parcourir un damier constitué de mil- mente la scientifique du LIG, mais y de stockage. » Mais cette logique fédéra- lions de lignes et de colonnes pour y repérer parvenir à l’échelle de cette gigantesque tive se heurte à des difficultés techniques. une poignée de motifs répétés », explique
JDC269
To see the actual publication please follow the link above