Le Collège Technologies du Langage Humain

Objectif du Collège

Les Technologies du Langage Humain (TLH) proposent des méthodes permettant une communication homme-machine naturelle, pouvant s’étendre à une interaction homme-homme médiée. Ainsi, les TLH permettent d’analyser, d’interpréter et de produire des actes du langage écrit, parlé ou signé, mais aussi d’interagir avec des données langagières. Ainsi, les TLH englobent traditionnellement le Traitement Automatique des Langues (TAL), la Communication Parlée (CP) et leurs applications les plus emblématiques comme la Recherche d’Information (RI) et la Traduction Automatique.

Les TLH occupent une part entière en IA sous le prisme du Test de Turing. Ainsi, elles regroupent tous les axes de recherche de l’IA dans le cadre des données langagières comme la représentation (e.g. plongements lexicaux, analyse syntaxique), le raisonnement (e.g. systèmes de question-réponse), la planification (e.g. argumentation), l’apprentissage (e.g. analyse de sentiments), ou même l’intelligence collective (e.g. détection de communautés). Créer des modèles pouvant interagir de manière élégante et naturelle en utilisant la langue nécessite une compréhension profonde de l’acoustique, de la phonétique et de la prosodie pour le langage oral d’une part (dans le cadre de la reconnaissance et de la synthèse de la parole), et d’autre part, de la morphologie, de la syntaxe, de la sémantique et de la pragmatique pour le langage écrit ou signé (dans le cadre de l’analyse et de la génération de textes). Seulement à cette condition les applications des TLH peuvent offrir la promesse d’un accès « universel » à l’information, notamment à travers les moteurs de recherche, la traduction automatique, le résumé de textes, la veille automatique ou les systèmes de question-réponse. La compréhension globale du langage permet également de caractériser les textes suivant leurs objectifs communicationnels. Ainsi, l’analyse des sentiments et des émotions, l’identification de discours haineux, la détection de plagiats, l’identification et la vérification du locuteur proposent autant de cadres applicatifs importants pour les sociétés numériques.

Parallèlement au développement de modèles des TLH, de nombreux défis connexes doivent être pris en compte dans le cadre d’une démarche globale, comme la confiance (e.g. reproductibilité, explicabilité, confidentialité), l’éthique (e.g. biais d’apprentissage, représentativité) et l’évaluation (e.g. métriques dédiées) des systèmes proposés.

Puisqu’à l’ère du numérique les données langagières prolifèrent dans des quantités toujours plus importantes et accessibles (big data), les champs d’applications des TLH sont nombreux. Ainsi, les archives numériques, les réseaux sociaux, les plateformes collaboratives, les entretiens clients, les textos, les courriels, les commentaires sur des plateformes de vente en ligne sont autant de matières premières pour le développement d’applications des TLH. En particulier, quelques domaines privilégiés sont la santé, l’éducation, le droit, le journalisme et le handicap, mais d’autres émergent comme la finance, l’agriculture, la sécurité, le marketing et les humanités numériques.

Le collège TLH de l’AFIA a donc pour mission de promouvoir l’animation et l’interaction scientifiques entre les communautés TAL, CP et RI, et l’ensemble des communautés en IA ayant des intérêts communs dans le but de consolider les collaborations transversales.

Programme de travail

Afin de mener à bien sa mission, le collège TLH s’engage à soutenir l’organisation de manifestations scientifiques (conférences, ateliers), animer des groupes de travail, éditer des dossiers techniques, organiser des journées thématiques et diffuser et communiquer autour des recherches des communautés françaises du TAL, de la CP, de la RI et de l’IA.

Le collège TLH s’engage également à servir de canal de communication entre l’AFIA et ses collèges ainsi qu’avec l’AFCP (Association Francophone de la Communication Parlée), l’ARIA (Association Francophone de Recherche d’Information et Applications), et avec l’ATALA (Association pour le Traitement Automatique des Langues.

Comité de Pilotage
Le comité de pilotage du collège est constitué de 10 chercheuses et chercheurs spécialisés dans le domaine du TAL, de la CP et de la RI :
  • Florian Boudin, Université de Nantes, LS2N, Nantes
  • Davide Buscaldi, Université Paris 13, LIPN, Villetaneuse
  • Gaël Dias, Université de Caen Normandie, GREYC, Caen
  • Corinne Fredouille, Université d’Avignon, LIA, Avignon
  • José Moreno, Université Paul Sabatier, IRIT, Toulouse
  • Aurélie Névéol , CNRS, LIMSI, Saclay
  • Yannick Parmentier, Université de Lorraine, LORIA, Nancy
  • François Portet, Grenoble INP, LIG, Grenoble
  • Mathieu Roche, CIRAD, TETIS, Montpellier
  • Serena Villata, CNRS, I3S, Sophia Antipolis
Contacts