Menu principal

Postdoctorat portant sur l’extraction de relations dans des transcriptions textuelles

Postdoctorat portant sur l’extraction de relations dans  des transcriptions textuelles

Le laboratoire GREYC CNRS UMR 6072 (Université de Caen Normandie) en collaboration avec l'IRISA CNRS UMR 6074 et le LIPN CNRS UMR 7030 recrute un(e) postdoctorant(e) dans le cadre du projet REUs financé par le FUI22.

 

* Contexte *

Dans les entreprises, les réunions sont connues pour être  consommatrices de temps. Selon une étude menée par Microsoft, les employés passeraient en moyenne 5,6h par semaine en réunion.  Le projet REUs vise à concevoir un logiciel d’aide à la préparation et au suivi de réunions de type suivi de projets. Il se basera uniquement sur les flux sonores des interactions entre les participants aux réunions et sur des ressources linguistiques.

* Sujet *

Le ou la postdoctorant(e) travaillera sur l’extraction d’information à partir de données textuelles. La démarche est, à partir des transcriptions textuelles des discussions, de trouver des relations entre tâches, participants, objectifs, etc., discutées pendant la réunion, afin de générer un rapport.

Plus précisément, à partir de transcriptions textuelles des discussions formant des corpus d’apprentissage, il s’agit d’apprendre comment détecter les événements et les relier entre eux au sein d’une phrase ainsi qu'à capter des relations dont la portée dépasse la phrase, comme associer une information à un contexte cité précédemment ou relevant de l’analyse de la prise de parole. Pour cela, nous nous appuierons sur les méthodes de fouille de données textuelles développées notamment au sein du consortium et qui extraient des motifs séquentiels formant de potentiels patrons linguistiques. Ces méthodes nécessiteront de nouveaux développements pour intégrer des spécificités du corpus comme le fait que celui-ci est organisé sous forme de dialogue et aussi d'intégrer le contexte dans lequel se situe un motif, ce dernier point est à ce jour très peu développé en fouille de données.

Le ou la postdoctorant(e) devra donc collaborer avec les autres membres du projet REUs pour le développement d’approches adaptées s’appuyant sur la fouille de motifs et le traitement des langues pour extraire ces relations.

Les aspects en lien avec la transcription textuelle seront traités par un autre partenaires du projet.

* Profil *

Le ou la candidat(e) devra avoir obtenu une thèse en informatique et une expérience en fouille de données, ou apprentissage, et/ou en traitement de la langue. Des compétences en programmation sont nécessaires.

Date de début : début 2017

Durée : 12 mois (extensible)

Environnement de travail : Caen, laboratoire GREYC (équipe CoDaG)

Contact :
Peggy Cellier cellier@irisa.fr
Thierry Charnois thierry.charnois@lipn.univ-paris13.fr
Bruno Crémilleux bruno.cremilleux@unicaen.fr
Albrecht Zimmermann albrecht.zimmermann@unicaen.fr


Mots-clés
fouille de données; traitement automatique de langue
Établissement
GROUPE DE RECHERCHE EN INFORMATIQUE, IMAGE, AUTOMATIQUE ET INSTRUMENTATION DE CAEN
14032 CAEN  
Langues obligatoires
Anglais; Français
Type de contrat
CDD
Type de poste
Postdoc
Prérequis

Le ou la candidat(e) devra avoir obtenu une thèse en informatique et une expérience en fouille de données, ou apprentissage, et/ou en traitement de la langue. Des compétences en programmation sont nécessaires.

Date limite
01/04/2017
Informations de contact

Peggy Cellier , Thierry Charnois , Bruno Crémilleux , Albrecht Zimmermann