Accueil du site > Actualité de la recherche > Actualités scientifiques




Recherchez sur ce site


Interview de Gabriel Peyré

8 avril 2020

Interview de Gabriel Peyré, directeur de recherche au CNRS, orateur invité au 8e Congrès européen des mathématiciens, ECM 2020.

PDF - 180.5 ko
English version

Quel est votre domaine de recherche ?

Je suis un mathématicien appliqué. Mes deux domaines principaux d’application sont l’imagerie et l’apprentissage machine. L’imagerie concerne par exemple le traitement d’image, cela peut-être aussi l’imagerie médicale, l’imagerie astrophysique, l’imagerie biologique… Pour l’apprentissage machine, on parle couramment de machine learning, voire beaucoup plus largement d’intelligence artificielle. Il s’agit d’apprendre aux machines à exécuter des tâches. Les outils que j’utilise ont souvent trait à la théorie dite du transport optimal. C’est un sujet de recherche très ancien, qui a été introduit par Gaspard Monge, mathématicien et homme politique français du 18e siècle. Il a formulé le problème sans pouvoir le résoudre. Il s’agissait pour lui de déterminer, en contexte militaire, la façon la plus économique de transporter des déblais de terre entre deux endroits pour faire des remblais. Il faut attendre les années 1940 pour qu’un mathématicien russe, Leonid Kantorovitch, commence à savoir le résoudre dans un contexte économique. Il a reçu le prix Nobel d’économie dans les années 1970 pour ses découvertes sur le transport optimal. Depuis quatre ou cinq ans, les chercheurs s’y sont intéressés pour l’appliquer à l’imagerie et à l’apprentissage machine et améliorer les méthodes dans ces deux disciplines.

Quel est votre apport dans ces domaines comme mathématicien ?

L’imagerie et l’apprentissage sont des domaines presque à part entière qui recouvrent plusieurs disciplines. Ils nécessitent des chercheurs en informatique, en ingénierie et en mathématiques. Comme mathématicien, j’apporte un regard théorique et de méthodologie et de ce point de vue, il y a besoin de mathématiques à tous les niveaux. Il faut d’abord modéliser mathématiquement les problèmes, c’est-à-dire les comprendre de façon précise et les mettre en équation. Puis développer des méthodes d’approche mathématique et numérique pour les résoudre. Vient alors la partie « classique » de résolution de problèmes : on démontre des théorèmes. Puis vient la partie informatique, qui consiste à développer des algorithmes. Celle-ci va souvent de pair avec la partie théorique. Car pour développer des algorithmes efficaces, il faut comprendre la structure des problèmes, leur géométrie, c’est-à-dire les relations entre les objets, et il faut hiérarchiser ces objets. Ce travail théorique donne l’essentiel des algorithmes et il relève des mathématiques. Et enfin dans certains cas, on travaille aussi en collaboration avec d’autres domaines scientifiques, ceux qui font des expériences, manipulent des données, par exemple l’imagerie médicale, les neurosciences, la génomique, l’imagerie biologique, pour appliquer les méthodes à des cas réels. Ce n’est pas trivial, cela nécessite de comprendre les enjeux de ces problèmes-là et d’y adapter les méthodes.

Comment se fait votre interaction avec les scientifiques qui manipulent les données ?

Il faut voir toute cette chaîne que je viens de vous décrire : modélisation, développement des méthodes, démonstration théorique, création des algorithmes, application à des données réelles, comme différents blocs qui constituent les recherches, avec un va-et-vient entre eux. Faire des mathématiques appliquées, ce n’est pas aller à un seul sens de la théorie aux cas réels. C’est un dialogue permanent pour appliquer toute cette chaîne à des cas réels. En discutant avec ceux qui font les expériences, on comprend qu’il faut développer notre méthode autrement et on est amené à la réviser. Ou bien on peut être interpelé par une question importante, par exemple en neurosciences, qui nous pousse à développer une théorie nouvelle, et cela génère parfois d’autres théories à développer, qui peuvent parfois être sans rapport avec le problème concret d’origine. Et enfin, ce n’est pas non plus toujours le cas, en mathématiques appliquées, qu’on aille concrètement se confronter à l’expérience ou à des applications très concrètes.

Sur quoi portent actuellement vos recherches ?

Depuis quatre ou cinq ans, j’utilise la théorie du transport optimal pour essayer de mieux comprendre et maîtriser les méthodes de réseaux de neurones dans les domaines de l’imagerie et de l’apprentissage.

La question qui m’intéresse est l’apprentissage avec, au centre, l’apprentissage humain et sa question fondamentale, comprendre comment fonctionne le cerveau, et son pendant informatique : comment les machines peuvent-elles apprendre, et faut-il que cela se fasse comme le cerveau humain ou faut-il le leur faire faire différemment ? Entre les deux, le fossé est immense et on ne sait pas encore comment faire.

Il y a eu depuis 2012 une résurgence des méthodes de réseaux de neurones. Cette méthode, qui était devenue obsolète pendant des années, s’est tout à coup imposée comme une méthode qui marche et elle a eu un impact fort sur l’apprentissage mais également dans toutes les disciplines des sciences, où tout le monde a commencé à utiliser des méthodes issues des réseaux de neurones. Ce sont des méthodes qui marchent sans qu’on sache pourquoi, qu’on a du mal à améliorer et qui comportent clairement des points qu’on ne comprend pas. De sorte qu’il y a besoin de mathématiciens pour formaliser les questions qu’on se pose dans ces disciplines-là, pour pouvoir les comprendre théoriquement. Ce qui m’intéresse à l’heure actuelle, c’est de pouvoir porter un regard mathématique et méthodologique sur la performance des méthodes qui utilisent des réseaux de neurones et un outil pour faire cela, c’est la théorie du transport optimal.

Quels sont les enjeux de ces recherches ?

Le domaine de l’apprentissage est un champ scientifique en explosion notamment parce qu’il y a des enjeux industriels majeurs pour toutes les compagnies, technologiques et autres, qui ont à traiter des gros jeux de données, d’images, de vidéos, de textes. Les réseaux sociaux par exemple ont d’énormes masses de données en textes et en relations sociales. Pour les comprendre, il faut d’énormes réseaux qui permettent d’automatiser toutes les tâches, classifier des images, traduire des textes, reconnaître les images, traduire des sous-titres de vidéos, générer des images de synthèse, créer des animations virtuelles… L’apprentissage touche aussi l’industrie automobile avec l’enjeu de la voiture autonome. Il y a aussi des impacts en science plus théorique au sens où les réseaux de neurones vont être utilisés pour comprendre des théories de la physique, pour analyser des données en biologie… Mais ce sont des méthodes très complexes, qu’on ne sait pas trop maîtriser. Et cela pose la question de savoir ce qu’est vraiment un réseau de neurones : peut-on savoir exactement ce que fait le réseau, comment l’utiliser de façon à être un peu sûr de ce que fait le réseau…

Comment fonctionne un réseau de neurones ?

La méthode des réseaux de neurones est un algorithme. Un algorithme est un concept très général : c’est quelque chose qu’on peut mettre sur un ordinateur et qui va résoudre une tâche. Les algorithmes classiques sont programmés par des programmeurs pour faire leur tâche le plus efficacement possible. Ils nécessitent de très bons programmeurs. Les algorithmes d’apprentissage, parmi lesquels les réseaux de neurones sont les plus connus, ne sont pas en eux-mêmes compliqués, mais ils s’adaptent en fonction de données qu’on leur donne en exemple. Plutôt qu’un être humain programme un algorithme pour exécuter une tâche, on va lui montrer un grand nombre d’exemples : « ceci est une voiture », « ceci est un chien » etc. des millions de fois, et l’algorithme va s’adapter automatiquement, changer ses composantes internes, pour résoudre la tâche le plus efficacement possible. La nouveauté des algorithmes issus de l’apprentissage, c’est qu’ils ont besoin de beaucoup de données et de beaucoup de temps de calcul pour que l’algorithme s’adapte automatiquement.

Les réseaux de neurones sont un exemple particulier d’algorithme, mais on n’a jamais vu un algorithme qui ait eu un impact aussi impressionnant, impact sur la recherche et impact sociologique. En six mois de grosses compagnies ont embauché des chercheurs qui travaillaient dessus. Et la grande nouveauté importante à faire comprendre, c’est que le monde maintenant va être dominé ou réglé par des algorithmes qui apprennent à partir des données et qui ne sont plus vraiment programmés.

On a besoin de continuer à former des programmeurs, mais on a aussi besoin de former des personnes qui sont capables de comprendre comment les algorithmes vont utiliser les données pour se programmer eux-mêmes.

Où interviennent les mathématiques dans le développement des algorithmes ?

Le développement d’un algorithme demande des mathématiques à tous les niveaux. Comprendre, formaliser le problème que l’algorithme cherche à résoudre, demande des mathématiques. Souvent un algorithme résout un problème mathématique, comme par exemple de classer des nombres. Il peut y avoir des problèmes plus compliqués, notamment en apprentissage. On a besoin de mathématiques pour développer un algorithme efficace. Il peut y avoir plusieurs algorithmes possibles pour résoudre une même tâche et le but serait d’avoir un algorithme qui soit ira le plus vite possible, soit donnera la meilleure solution possible, par exemple, en apprentissage, l’algorithme qui reconnaîtrait le mieux possible des images. Et ce choix nécessite des mathématiques pour comprendre la structure du problème, l’analyser, le découper en sous-problèmes, comprendre comment les différents problèmes dépendent les uns des autres : il s’agit de comprendre la géométrie de la question. On peut difficilement penser développer des algorithmes très efficaces si on ne fait pas des mathématiques à ce niveau-là. Une fois qu’on a développé un algorithme qu’on pense être efficace, c’est-à-dire rapide mais aussi performant, il faut aussi après pouvoir le prouver mathématiquement. Il faut pouvoir également comprendre théoriquement les cas où l’algorithme ne fonctionne pas ou bien fonctionne mal, ce qui est crucial pour pouvoir ensuite l’améliorer. D’où un nouveau un va-et-vient : il faut de nouveau trouver un algorithme, il y a de nouveau une certification théorique à apporter. Et une fois qu’un algorithme est certifié, cela permet de se poser la question : quels sont les points qu’on peut améliorer ? Ce qui peut amener à revisiter sa copie, en itération. Les maths interviennent à tous les niveaux !

Comment en êtes-vous venu à faire des mathématiques ?

J’ai eu un parcours assez classique, j’étais plutôt bon en maths, mais je ne pense pas avoir fait des maths par défaut. Ce qui m’attirait dans les mathématiques, comme dans les rédactions en français, c’était le côté créatif. J’aimais analyser les problèmes et les résoudre, comme un jeu. C’était excitant parce qu’il y a des questions dont on ne sait pas trop comment les résoudre. Je pense que j’ai toujours su que c’est ce que je voulais faire.

Y a-t-il pour vous une frontière entre mathématiques et mathématiques appliquées ?

Cela ne me semble pas productif de présenter un paysage mathématique où il y aurait d’un côté les mathématiques pures, de l’autre les mathématiques appliquées. Les mathématiques appliquées, ce sont des mathématiques. On croit souvent que les mathématiques appliquées, c’est d’appliquer des mathématiques – des concepts, des théories mathématiques existantes à un problème réel. C’est ce que font les autres sciences, par exemple les ingénieurs ou les physiciens. Mais faire des mathématiques appliquées, c’est trouver de nouvelles maths, et ces nouvelles théories qu’on étudie et qu’on développe, on fait aussi le travail de les confronter avec des problèmes plus concrets qui nous entourent, et de faire cela en interaction. Il ne me paraît pas possible de mettre une barrière entre mathématiques fondamentales et mathématiques appliquées. Certains mathématiciens font plus de théorie, d’autres sont plus dans le concret. Au quotidien, c’est très relatif : dans certaines situations on a une posture de mathématicien très théoricien à expliquer des mathématiques qui ont l’air très théoriques à tel interlocuteur, et parfois on discute avec des gens qui font des mathématiques très abstraites et on va aussi être très à l’aise à discuter de choses très abstraites avec eux. Notre rôle comme mathématicien appliqué varie en fonction des collaborations et des interactions, des problèmes qu’on résout ou des questions qu’on étudie.

Quelle place prend le travail en collaboration dans votre façon de travailler ?

Je mène la plupart de mes recherches en collaboration. Cela ne m’arrive jamais de mener un problème de bout en bout de façon autonome. S’il y a des moments où je travaille tout seul de manière autonome, il y a toujours un moment où je vais en discuter avec des collaborateurs et où on interagit. Mes collaborateurs, ce sont mes étudiants, les collègues, les chercheurs d’autres domaines, voire des personnes qui travaillent dans l’industrie même si je n’ai pas vraiment à proprement parler de collaborations industrielles.

L’environnement scientifique est important : assister à des conférences, discuter autour d’un café… c’est comme cela que les projets débutent. On ne peut pas décréter qu’on va collaborer sur un sujet avec untel : on ne décide pas d’aller discuter avec untel parce qu’il est par exemple physicien. Cela commence par une occasion lambda, on dégrossit un problème et parfois cela donne naissance à une collaboration. Il faut qu’il y ait un point de convergence d’intérêt commun. Il est important d’avoir beaucoup d’interactions pour que cela puisse de temps en temps déboucher sur une collaboration. Et ce qui est intéressant aussi dans les collaborations est que l’on peut aussi connecter des gens entre eux – dire : sur tel aspect, telle personne est spécialiste, allez la contacter.

J’ai beaucoup d’interlocuteurs différents parce que j’apprends de nouveaux aspects théoriques et applicatifs différents et j’aime travailler en parallèle sur plusieurs sujets très variés soit avec une même cohérence derrière, soit avec le même genre d’outil. Pour trouver des nouveaux problèmes, il est important de discuter avec de nombreuses personnes. Il faut évidemment ne pas se disperser, il faut être sûr qu’on va pouvoir faire avancer les sujets sur lesquels on travaille. De ce point de vue, la collaboration avec les étudiants est porteuse. Ils nous rappellent à des questions tous les jours… Cela a aussi un aspect pragmatique !

À quoi servent les mathématiques ?

Les mathématiques sont nécessaires dans tous les domaines des sciences. Il est important de ne pas perdre de vue cela.

Je travaille en machine learning, où on entend souvent dire qu’il n’y a pas besoin de mathématiques parce que ça marche. Mais je pense que les mathématiques apportent le recul théorique pour approfondir les problèmes et les modéliser et pour certifier les méthodes. Sans les mathématiques, on avance moins vite et on a du mal à construire un édifice solide, même dans des domaines qui ont l’apparence de marcher très bien sans elles. Les mathématiques sont là pour apporter une cohérence qui peut être assez compliquée en science, et aussi pour apporter le langage : quelqu’un qui ne maîtrise pas le langage mathématique va avoir du mal à formuler des problèmes. Les mathématiques sont avant tout le langage des sciences, mais cela ne s’arrête pas là. Faire des démonstrations mathématiques, ce n’est pas juste pour l’élégance, cela permet un recul théorique sur le contexte qui permet ensuite de concevoir des objets plus compliqués. Et cela, il y en a besoin partout, même dans des domaines où on ne pense pas trop aux mathématiques. En médecine par exemple, ou en intelligence artificielle, dès qu’on veut aborder des concepts compliqués, on va beaucoup plus vite si on les écrit de façon concise avec un langage universel. Ce n’est pas que cela, les mathématiques, mais le fait d’apporter un langage et une façon de construire les objets est la première étape. Et puis certifier les choses qu’on fait pour apporter une garantie théorique permet de construire un édifice solide qu’on va faire pouvoir grandir.

Vous avez en page d’accueil de votre site web le fil de votre compte twitter. Comment décririez-vous la place de la diffusion dans la façon dont vous exercez votre métier ?

La diffusion des savoirs, la médiation scientifique sont très importantes pour moi, notamment parce qu’il importe que les jeunes fassent de la science. J’interviens dans des collèges et des lycées, je donne des conférences grand public et j’en organise, comme le trimestre thématique sur les mathématiques de l’imagerie à l’Institut Henri Poincaré l’an dernier. L’interaction avec les jeunes enrichit. Qu’ils aient ou non une culture mathématique, ils ont toujours des questions très pertinentes et peuvent poser des questions non triviales. Soit on sait répondre, et ça permet de reformuler les choses, de les simplifier, de les aborder sous un nouveau prisme. Soit on ne sait pas répondre, et ça peut ouvrir un problème, ça peut être assez profond. J’interviens aussi auprès de l’association TRACES, qui est hébergée par l’Espace de médiation scientifique Pierre Gilles de Gennes. J’écris pour Images des mathématiques, mais aussi pour Horizons et sur le bulletin de l’APMEP, pour le public des professeurs de lycée car ce sont eux qui sont en contact avec les jeunes et cela fait partie de leur formation d’enseignantes et enseignants.

Les twitts que je poste s’adressent moins aux jeunes qu’aux autres scientifiques, à un public qui a un niveau suffisant pour les équations. Je poste en alternance un jour sur deux un article qui a trait aux mathématiques et une note qui porte sur un concept de mathématiques appliquées. Les « Oldies but goldies » sont des articles scientifiques anciens, qui ont plus de 20 ans… des articles de Gaspard Monge d’il y a trois cents ans, des articles oubliés… Les posts de concepts mathématiques, ce peuvent être des sujets auxquels je m’intéresse, et d’écrire dessus me fait travailler et me permet de comprendre. Ce sont aussi des éléments accumulés depuis des années au cours de ma recherche, des tests que je faisais en apprenant… Si bien que ce compte twitter me permet de valoriser tout ce qu’on fait en marge de la recherche. J’y joins une animation : chaque twitt est fait maison, ce sont des contenus originaux !

Quel message aimeriez-vous faire passer aux jeunes ?

J’aimerais dire aux jeunes qu’il y a un domaine en pleine explosion, avec des enjeux scientifiques, industriels et sociétaux, qui n’est pas près de disparaître : le machine learning ou intelligence artificielle. C’est un domaine dans lequel il y aura du travail pendant les vingt ans à venir, mais pas seulement : c’est un domaine à investir, avec des questions mathématiques extrêmement intéressantes et excitantes, des solutions innovantes à apporter. On connaît un peu les mathématiques qu’on a besoin d’utiliser pour comprendre les choses dans un domaine comme la physique. Par contre en apprentissage, et en neuroscience pour tout ce qui touche à l’apprentissage humain, on ne sait pas encore quelles mathématiques sont impliquées. On ne les connaît pas encore, il faut les inventer. L’apprentissage machine est une nouvelle frontière. La France est très compétente sur ces questions-là parce que l’école mathématique est très forte, les mathématiques appliquées sont très développées en France. Et il y faut des mathématiciens. Et des mathématiciennes ! Qu’il y ait peu de filles qui s’engagent en science est très dommageable à la science.

Qu’est-ce que cela représente pour vous d’être orateur invité à l’ECM ?

C’est la première fois que je suis invité à une conférence comme celle-là. C’est bien sûr un honneur, et une reconnaissance aussi. S’il y a un message qu’on pourrait faire passer, ce serait d’inviter les jeunes – ces invitations arrivent toujours un peu trop tard dans une carrière. Ce serait un encouragement et cela mettrait les jeunes en avant.

Gabriel Peyré est directeur de recherche au CNRS et professeur à l’École normale supérieure. Il est membre du département de mathématiques et applications de l’ENS Paris (DMA - CNRS & ENS Paris).