Le sujet se situe dans le contexte de la recherche d’information via des systèmes de recherche documentaire. A partir d’un ensemble de documents restitués par ordre de pertinence comme réponse à une requête, nous nous intéressons à la génération automatique d’un document de synthèse, le document composite, qui constituerait une « meilleure » réponse à la requête que les documents fournis initialement comme réponse par le système.

 

Le travail consistera à caractériser la notion de document et plus exactement de bon document  au travers de critères impliquant la taille du document, la quantité d’information qu’il délivre, l’adéquation avec le besoin d’information exprimée par la requête, la forme rhétorique du document (i.e. son organisation, les différents aspects de la question dont il traite etc.).

 

Du point de vue algorithmique, nous serons amenés à définir de nouvelles mesures quantifiant la pertinence des documents. On posera le problème en termes d’optimisation multi-objectif pour gérer les multiples critères de caractérisation des « bons » documents.

 

 


Mots-clés
apprentissage automatique; extraction de connaissaces; fouille de textes
Directeur
Tassadit Amghar
Co-encadrants
Touria Ait El Mekki et Bernard Levrat
Langues obligatoires
Anglais; Français
Prérequis

Niveau : Master 2 ou ingénieur informatique

Connaissance en TAL et en apprentissage automatique

Date limite
31/01/2019
Informations de contact

Tassadit Amghar (LERIA), tassadit.amghar@univ-angers.fr (0241735075)
Touria Ait El Mekki (LERIA), touria.aitelmekki@univ-angers.fr (0241735086)
Bernard Levrat (LERIA),bernard.levrat@univ-angers.fr