Durée : CDD de 9 mois
Organisation : Université Paris Descartes
Début : octobre 2019
Financement : Projet industriel de collaboration

1. CONTEXTE

Nous échangeons de nombreux documents électroniques et le format d’échange le plus utilisé est le format développé par la société Adobe, le pdf. Ce format est bien adapté pour faire une impression du document mais le document original a souvent été réalisé à l’aide d’un logiciel métier, et ils sont très nombreux utilisant des formats de stockage non publics. Le format pdf est donc un format d’échange mais les informations contenues dans le fichier initial sont très largement perdues. Par contre la gestion ou l’accessibilité aux fichiers nécessite une compréhension au moins partielle du contenu.

En fonction de l’avancement des travaux et des développements réalisés, il est fortement envisagé que l’entreprise avec laquelle nous collaborons propose un CDI pour réaliser d’autres projets permettant le lien entre un document au format pdf et une visualisation sur Internet.

2. LE PROJET

Le travail repose sur une analyse des contenus des fichiers pdf, analyse basée sur les outils destinés aux développeurs et distribués par adobe. La décomposition des éléments visuels et leurs positions relatives permettra de reconstruire les éléments visuels auxquels l’œil humain est sensible.
Une mo
délisation des objets classiques que l’on peut trouver dans des documents classiques devra être formalisée, tout en optimisant l’interprétation globale du document. Cette modélisation pourra être envisagée de manière hiérarchique.

3. LOCALISATION

Le travail sera réalisé au LIPADE (Laboratoire d'Informatique Paris Descartes), sous la direction de N. Vincent de l’équipe SIP (Systèmes Intelligents de Perception) et de P. Moraitis de l’équipe IAD (Intelligence Artificielle Distribuée). L’équipe SIP est spécialisée en analyse et interprétation d’images. L’équipe IAD est spécialisée dans la représentation des connaissances et la modélisation du raisonnement pour la conception d’agents intelligents. Le laboratoire est situé à Paris intramuros, 45 Rue des Saints-Pères, 75006 Paris.

4. CANDIDATURE

Nous recherchons un(e) candidat(e) motivé(e), titulaire d’un master2 ou d’un PhD en informatique avec une bonne expérience en programmation (e.g. C++, Java, python). Un bon esprit d’analyse, d’expérience en structuration des données et en intelligence artificielle sont nécessaires. Ce peut être un avantage d’avoir des connaissances en analyse d’images de documents.

Les candidats doivent envoyer leur CV et lettre de motivation à :

Nicole VINCENT (nicole.vincent@mi.parisdescartes.fr)
Pavlos MORAITIS (pavlos@mi.parisdescartes.fr)


Mots-clés
analyse d'images; données structurées
Établissement
LABORATOIRE INFORMATIQUE PARIS DESCARTES (LIPADE)
75270 PARIS  
Site Web
http://lipade.mi.parisdescartes.fr/?lang=fr
Date de début souhaitée
01/10/2019
Type de contrat
CDD
Type de poste
Ingénieur
Prérequis

Nous recherchons un(e) candidat(e) motivé(e), titulaire d’un master2 ou d’un PhD en informatique avec une bonne expérience en programmation (e.g. C++, Java, python). Un bon esprit d’analyse, d’expérience en structuration des données et en intelligence artificielle sont nécessaires. Ce peut être un avantage d’avoir des connaissances en analyse d’images de documents.

Informations de contact

Nicole VINCENT (nicole.vincent@mi.parisdescartes.fr)
Pavlos MORAITIS (pavlos@mi.parisdescartes.fr)