Menu principal

Stage post-posdoctoral sur le versant littéraire des humanités numériques

Ce poste est destiné à un jeune chercheur en intelligence artificielle qui porte un intérêt aux humanités numériques.

 

Fonction

  • Développement et validation de logiciels pour les humanités numériques
  • Outils d’indexation de corpus littéraire avec des ontologies

Des outils numériques de comparaison de textes, de recherche d’homologies dans les textes, de détection d’entités nommées, d’indexation sémantique, de cartographie de corpus, etc. ont été réalisés ces dernières années dans le cadre de l’équipe ACASA du LIP6 - Université Pierre et Marie Curie et du labex OBVIL.

Il s’agit maintenant de les déployer sur de très gros corpus textuels français et anglais fournis par la Bibliothèque Nationale de France et l’université de Chicago (plus de 300000 ouvrages) et de les mettre à disposition d’une communauté large composée non seulement des chercheurs en littérature de l’OBVIL mais aussi de l’ensemble du public intéressé. Le chercheur contribuera au déploiement et à la validation de ces algorithmes sur des corpus conséquents, ce qui pourra passer par leur parallélisation. Il s’agit aussi de les rendre accessible à un public large par une interface web.

Le Labex OBVIL

Le Laboratoire d’excellence OBVIL s’inscrit dans le cadre de la COMUE Sorbonne-Universités et réunit des chercheurs appartenant à 7 équipes d’accueil, à 2 UMR (unités mixtes université/CNRS) et à un programme transversal de l’UMS de la Maison de la Recherche de Paris-Sorbonne. Il regroupe des enseignants-chercheurs et des chercheurs des universités Paris-Sorbonne et Pierre-et-Marie-Curie, les uns spécialistes de littérature, les autres d’informatique, de traitement automatique de la langue naturelle et de fouille de textes.

Il entend développer toutes les ressources offertes par l’intelligence artificielle et le traitement de grandes masses de données textuelles (Big Data) pour examiner aussi bien la littérature française du passé que la plus contemporaine.

Ouvertures

 

Comme dit plus haut, ce projet se réalisera dans le cadre du Labex OBVIL. Ce Labex entretien des liens privilégié avec la Bibliothèque Nationale de France, qui met à notre disposition un corpus de 130000 ouvrages, et avec le projet ARTFL de l'université de Chicago avec qui nous avons plusieurs échanges dans le cadre d’un projet financé par la fondation Mellon et la FMSH.


Mots-clés
apprentissage automatique; artificial intelligence; fouille de textes; humanités numériques; traitement automatique de langue
Établissement
Université Pierre et Marie Curie Paris 6
75252 Paris  
Site Web
http://obvil.paris-sorbonne.fr/
Date de début souhaitée
30/04/2017
Langues obligatoires
Anglais; Français
Type de contrat
CDD
Type de poste
Postdoc
Prérequis

Etre titulaire d’une thèse d’informatique sur le traitement du langage naturel ou la fouille de masses de données textuelles.

Avoir la capacité à s’intégrer à une équipe de recherche en informatique et montrer un intérêt pour les humanités numériques.
Maitriser:
- les concepts fondamentaux de l’intelligence artificielle
- les techniques de base du traitement de la langue naturelle (étiquetage syntaxique, analyse syntaxique, etc.)
- les algorithmes d’apprentissage machine et de fouille de données textuelles,

Date limite
31/05/2017
Informations de contact

Jean-Gabriel Ganascia