IA et logiciels libres : LINAGORA et le CNRS signent un accord-cadre pour renforcer leurs collaborations de recherche

Innovation

Le leader français des logiciels libres, LINAGORA, et le CNRS renforcent des liens tissés au cours d’une dizaine d’années de collaborations de recherche. L’entreprise se joint ainsi à la recherche académique pour développer les environnements de travail numériques de demain, ainsi que pour participer à l’émergence d’une IA générative open source et souveraine.

Pour accompagner et renforcer une forte dynamique de collaborations de recherche entre le CNRS et un partenaire économique, un accord-cadre peut être signé. Il permet notamment aux deux partenaires de dessiner une feuille de route commune et de faciliter la naissance de nouveaux projets. Ce dispositif concerne de prime abord les grands groupes, mais, le 26 février, le CNRS a signé son premier accord-cadre avec une PME française : Linagora.

Avec treize millions d’euros de chiffre d’affaires en 2023 et deux cents collaborateurs, LINAGORA est le leader français du logiciel libre. « En bientôt 25 ans d’existence, nous avons évolué avec le marché et LINAGORA se concentre à présent sur trois métiers, explique Michel-Marie Maudet, directeur général et cofondateur de LINAGORA. Nous éditons des logiciels libres et gratuits, nous proposons un soutien technique et assurantiel sur un vaste patrimoine de logiciels libres et communautaires et, enfin, nous fournissons un accompagnement et une expertise destinés aux professionnels. »

Ces axes s’articulent autour de thématiques comme les environnements de travail collaboratifs, avec la suite Twake Workplace qui va de la messagerie sécurisée au stockage de fichiers en ligne, et la reconnaissance vocale. LINAGORA s’implique aussi de plus en plus dans l’IA générative et les grands modèles de langage (LLM).

Des collaborations de recherche déjà nombreuses entre LINAGORA et le CNRS

L’entreprise investit quatre millions d’euros par an dans sa R&D, notamment via un centre basé à Toulouse, ce qui a déjà permis des collaborations avec le CNRS. Par exemple, LINAGORA a collaboré avec le Laboratoire d’informatique de l’École polytechnique (LIX, CNRS/École polytechnique) et le Laboratoire lorrain de recherche en informatique et ses applications (LORIA, CNRS/Inria/Université de Lorraine).

LINAGORA s’est associé en 2017 au LIX, à l’Institut de recherche en informatique de Toulouse (IRIT, CNRS/Toulouse INP/Univ. Toulouse Paul Sabatier) et au Laboratoire d’analyse et d’architecture des systèmes (LAAS-CNRS) pour développer LinTO. Cet assistant vocal spécialisé dans la transcription de réunions est désormais proposé par Linagora.

Utilisateur du supercalculateur Jean Zay du CNRS, LINAGORA travaille aussi avec l’Institut du développement et des ressources en informatique scientifique (IDRIS, CNRS) et le Grand équipement national de calcul intensif (GENCI). Ensemble, ils continuent d’améliorer Bloom, le modèle de langue multilingue et ouvert utilisé par la start-up Hugging Face.

Ces échanges se sont accélérés en 2023, avec le lancement du projet ANR LLM4ALL[1] avec des chercheurs du LORIA et du LIX. LLM4ALL vise à entraîner une IA, de type grand modèle de langage, pour des applications telles que l’assistance pendant des réunions et la gestion des appels d’urgence pour le SAMU. LINAGORA suit avec intérêt aussi les travaux réalisés dans le cadre du Programme et équipement prioritaire de recherche (PEPR) eNSEMBLE, piloté par le CNRS aux côtés de l’INRIA, de l’Université Grenoble Alpes et de l’Université Paris-Saclay, sur le futur de la collaboration numérique. Ce PEPR comprend beaucoup de travail sur les interfaces homme-machine, en particulier sur leur interopérabilité.

Le resserrement des liens entre LINAGORA et le CNRS a aussi été marqué par la participation de LINAGORA à plusieurs événements du Club CNRS Entreprise. L’accord-cadre a suivi.

Table ronde présentant des travaux de recherche communs entre des laboratoires sous tutelle du CNRS et LINAGORA / crédit : CNRS

Un accord-cadre pour établir une feuille de route commune

« Ce premier accord-cadre avec une PME française souligne que l’innovation et la recherche irriguent l’ensemble du tissu économique français », se réjouit Patrizia Borghetti, responsable des partenariats industriels stratégiques au CNRS. « Cet accord-cadre s’inscrit dans la continuité des relations de confiance établies depuis quelques années entre les laboratoires sous tutelle du CNRS et LINAGORA, avec qui nous partageons notre engagement en faveur du développement et de l’utilisation du logiciel libre, déclare Antoine Petit, PDG du CNRS. Il est également en phase avec le nouveau programme du CNRS de valorisation des logiciels libres, baptisé OPEN. LINAGORA nous fait bénéficier de toute son expérience en participant à la sélection des projets OPEN. »

L’accord-cadre entre LINAGORA et le CNRS a aussi permis d’établir une feuille de route, avec des axes sur le développement des environnements numérique de travail du futur, des infrastructures numériques souveraines et de l’IA générative open source et de confiance. L’IA compte d’ailleurs parmi les six grands défis sociétaux identifiés par le Contrat d’objectifs et de performance (COP) du CNRS. « Nous arrivons à un moment où la valorisation de nos résultats scientifiques passe de plus en plus par le partage des connaissances, tels que les logiciels libres, les bases des données ou les modèles d’IA pré-entrainés. Il y a déjà des collaborations avec plusieurs de nos laboratoires, mais la signature de cet accord-cadre permet de passer à un niveau supérieur avec l’un des principaux acteurs du logiciel libre en France : Linagora. Nous allons apporter des réponses ensemble à des défis importants, liés à l’IA de confiance et souveraine » explique Adeline Nazarenko, directrice de CNRS Sciences informatiques

Signe de l’intérêt suscité par ces sujets, la cérémonie du 26 février était placée sous le haut patronage du Président de la République française, du Ministre de l’Économie, des Finances et de la Souveraineté industrielle et numérique et de la Ministre de l’Enseignement supérieur et de la Recherche.

« Nous pensons que la meilleure façon de concurrencer les géants du numérique consiste à réunir la puissance de la recherche académique et industrielle, affirme Michel-Marie Maudet. Il n’y a pas de secret, développer de vraies IA génératives open source, souveraines et maîtrisées par des acteurs français ne pourra se faire sans le soutien de la recherche académique. Nous construisons ensemble des outils opérationnels pour répondre à ces enjeux, notamment formulés par le gouvernement depuis l’an dernier. »

Par exemple, pour qu’une IA de type LLM soit réellement open source, le jeu de données sur lequel l’IA s’entraîne doit l’être aussi. Or ce n’est généralement pas le cas, y compris chez des modèles pourtant présentés comme ouverts. LINAGORA, avec le soutien de la communauté OpenLLM France, mène pour cela une collecte de données d’entraînement éthique, qui respecte en particulier la réglementation européenne. Une étape essentielle pour poursuivre la feuille de route de ses objectifs aux côtés du CNRS.

 

[1] Grand modèle de langage pour tous.