Prédire les interactions protéine-protéine

L'objectif de ce stage est de proposer un format de données ainsi qu'un
modèle  de  deep  learning  pour  la  prédiction  d'interaction
protéine-protéine.   Ce  projet  de   recherche  se  fait  en  étroite
collaboration  avec  Stéphane  Téletchéa du  laboratoire  de  biologie
``Unité Fonctionnalité  et Ingénierie des Protéines''  de l'Université
de Nantes.  Stéphane Téletchéa fournira  les données brutes  à traiter
et apportera son expertise dans le domaine des interaction
protéine-protéine.

Ce projet de recherche contient plusieurs étapes :

1. Dans un  premier  temps, ne  prendre en  compte  que la  chaîne
polypeptidique (c'est-à-dire  la chaîne d'acides  aminés) composant
chaque protéine.  Le  format de données sera ici  simplement les deux
chaînes polypeptidique des  deux protéines à tester  pour prédire si
oui ou  non elles interagissent  entre elles. Il faudra  proposer et
expérimenter  un  modèle  de  deep  learning  apprenant  ces
interactions.

2. Avec les  mêmes données, la seconde étape consiste  à affiner la
prédiction pour non plus déterminer si deux protéines interagissent,
mais préciser  à quel(s)  niveau(x) dans leur  chaîne polypeptidique
respective l'interaction a lieu, s'il y en a une.

3. Enfin, l'objectif  ultime  de  ce projet  de  recherche est  de
descendre au niveau atomique en  prenant en compte la représentation
3D de la structure atomique de  chaque protéine, allant bien au delà
de la simple  chaîne polypeptidique. Un véritable  challenge se pose
alors pour trouver un format de données convenable ainsi qu'un modèle
de deep learning capable  de prédire où se situe l'interaction
au niveau atomique.  Une telle méthode de  prédiction serait inédite
dans le domaine, ce qui souligne le caractère ambitieux de ce projet
de recherche.


Mots-clés
Biologie; deep learning; machine learning
Établissement
Laboratoire des Sciences du Numérique de Nantes (LS2N)
44322 Nantes  
Site Web
http://richoux.fr/stages/deep_protein.pdf
Date de début souhaitée
02/01/2018
Langues obligatoires
Anglais
Niveau
Bac +5
Prérequis

Bonnes compétences de modélisation.
Connaissances en machine learning / deep learning / pytorch un plus.

Durée
5 à 6 mois
Indemnité
550 euros par mois (en fonction du nombre de jours ouvrés)
Date limite
01/04/2018
Informations de contact

florian.richoux@univ-nantes.fr