Page 24

JDC269

w 24 | cnrsI LE JOUrnAL L’enquête Une jungle à défricher a ner le tournis,ils soulèvent aussi une question essen- 04 05--ont de quoi donujourd’hui, si les chiffres correspondant aux informations numériques disponibles tielle : celle de la difficile analyse de ces masses de données considérables et en perpétuelle expansion. Professeur d’in- formatique et membre du Laboratoire d’informatique de Grenoble (LIG)1, Marie-Christine Rousset appartient à cette communauté de scientifiques qui tente de structurer le flot ininterrompu de données circulant sur la Toile : « Les pages que nous consultons tous les jours appartiennent au Web tex- tuel qui regroupe des milliards de documents reliés entre eux, tmIU R explique-t-elle.Pour autant ces pages ne peuvent pas être ex- NSo o ploitées comme une véritable base de connaissances car elles ont USC été conçues pour être lisibles par des êtres humains et non par © des machines. » Autrement dit, un mo- teur de recherche comme Google, dans 06 07 lequel nous formulons une requête, se contente de proposer une liste de mil- liers de documents correspondant à cette demande. Il laisse ensuite à l’usa- ger le fastidieux travail d’investigation destiné à identifier la réponse la plus pertinente à sa requête. ab Or face à l’accroissement vertigi- Il neux des documents disponibles sur able oPUS le Net, de tels modèles risquent d’être NS eSCe rapidement submergés par le flot I éeSDeS d’informations à gérer. Quelle est l’al- © oNNm ternative ? Faire évoluer le réseau ac- UrL. RIDx Sigle deUniform tuel vers un Web des données : « Cette Resource Locator :il NCe approche se fonde sur l’association de s’agit d’une chaîne CIe métadonnées aux adresses URL qui de caractères qui SNe/S identifient les pages Web. Elle vise à permet de localiser UChe une page ou un site ea casser lacomplexité du Web actuel, en sur le Web. .. structurant l’information sur Internet de ©o 08 La visUaLisation, soUrce d’interPrétation La profusion de données dont disposent les rapide et efficace la structure de ces masses chercheurs n’est pas toujours un avantage. En effet, d’informations. Car si l’évolution exponentielle des plus les données disponibles sont nombreuses, plus il capacités de calcul numérique a permis de générer devient compliqué de les interpréter. Au Laboratoire des quantités de données considérables au cours des bordelais de recherche en informatique (Labri)1, dix dernières années, les facultés d’analyse de notre David Auber et son équipe s’efforcent donc cerveau n’ont pas suivi la même évolution.« Notre d’améliorer la lisibilité de ces masses de données mémoire à court terme ne nous permet pas d’analyser grâce à des méthodes de visualisation analytique. simultanément plus de sept éléments distincts », « La démarche consiste à appliquer des outils souligne David Auber. Moyen efficace de résoudre mathématiques de type algorithmes sur ces données cette contradiction, le principe de la visualisation brutes pour faire ressortir les informations les plus analytique – via des interfaces d’aides à l’analyse pertinentes », explique le chercheur. Les données de données – pourrait ainsi rapidement devenir provenant des cours de la Bourse, de systèmes incontournable. de communications, des processus chimiques 1.UnitéCNRS/Universitébordeaux-1/Universitébordeaux- RI lab du métabolisme cellulaire, de réseaux géographiques Segalen/IPG  © 08 Une cartographie des communications entre ou sociaux peuvent ainsi être traduites sous forme cOntAct: 20.000 ordinateurs réalisée au Labri. de métaphores visuelles. Ces représentations doivent davidauber permettre aux chercheurs d’analyser de manière > david.auber@labri.fr


JDC269
To see the actual publication please follow the link above