CNRS : Centre National de la Recherche Scientifique
Liens utiles CNRSLe CNRSAnnuairesMots-Clefs du CNRSAutres sites
Accueil Département scientifique homme et société : Centre National de la reherche scientifiqueAccueil Département scientifique homme et société : Centre National de la reherche scientifique
  Accueil > La recherche en sciences humaines et sociales > Vie des Laboratoires

Vie des Laboratoires

 

UMR 7118 Analyse et traitement informatique de la langue française (ATILF)

Signature d'une charte de partenariat entre l'Est Républicain et le Centre national de ressources textuelles (CNRT) adossé à l'ATILF

Lorsque les rédacteurs du Trésor de la Langue Française ont emprunté pour les besoins de leurs articles, des citations à L’Est Républicain, ils étaient loin d’imaginer que quelques décennies plus tard, le même quotidien régional fournirait à une toute autre échelle et sous d’autres formes, des données textuelles au bénéfice de la communauté scientifique nationale et internationale dans le cadre de l’étude des évolutions de la langue française.
Les corpus journalistiques numérisés constituent au-delà d’un objet de recherche à explorer, une ressource linguistique à part entière, riche d’attestations permettant de constater au jour le jour, les usages de notre langue.


Le traitement automatique des langues (TAL) et la linguistique de corpus sont devenus, au cours des dernières années, des domaines-clés pour répondre aux besoins de notre société en terme d’analyse et d’exploitation de gisements d’informations, le plus souvent sous forme textuelle. L’analyse de l’évolution de la linguistique au cours du dernier demi-siècle montre en effet que sa confrontation avec l’informatique et les mathématiques lui a permis de se définir de nouvelles approches. La disponibilité de ressources textuelles électroniques de grandes tailles (corpus, bases de données textuelles, dictionnaires et lexiques) et les progrès de l’informatique, tant en matière de stockage que de puissance de calcul, ont créé, au cours des années 1990, un véritable engouement pour les approches statistiques et probabilistes sur « corpus ». Ainsi se structura petit à petit un nouveau champ de recherche : la linguistique de corpus permettant au linguiste d’aller au-delà de l’accumulation de faits de langue et de confronter ses théories à l’usage effectif de la langue. Dans ce cadre, la production induite de nouvelles ressources, l’accès intelligent à leurs contenus et leur diffusion en réseau constituent des résultats dont les enjeux sont majeurs dans notre société de l’information et du partage des connaissances.


Le Centre National de Ressources Textuelles et Lexicales
créé en 2005 par le CNRS et adossé à l’Unité Mixte de Recherche Analyse et Traitement Informatique de la Langue Française (ATILF, CNRS/Nancy-Université) s’inscrit dans cette dynamique comme en attestent son intégration au projet CLARIN (Common Langage Ressources and Technology Infrastructures) d’infrastructure européenne de recherche en sciences humaines et les 300 à 350 000 connexions quotidiennes de par le monde, en francophonie et hors francophonie.


L’écoute et l’intérêt tout à fait excellents de la Direction générale de L’Est Républicain a rendu possible un partenariat riche en symboles tout en ouvrant la perspective d’oeuvrer concrètement au service d’objectifs partagés.
La Direction du Département Sciences Humaines et Sociales du CNRS, celle du CNRTL et les tutelles de l’ATILF se félicitent de cette remarquable ouverture dans laquelle chacun saura voir un précieux exemple de l’ancrage de l’activité de recherche en sciences du langage dans le tissu socio-économique et local.


Jean-Marie PIERREL

 

picto lienEn savoir plus sur l'ATILF

picto lienDécouvrir le CNRTL

 

Accueil du Sitecontactimprimer Plan du sitecredits