L'objectif de ce stage est de proposer un format de données ainsi qu'un
modèle de deep learning pour la prédiction d'interaction
protéine-protéine. Ce projet de recherche se fait en étroite
collaboration avec Stéphane Téletchéa du laboratoire de biologie
``Unité Fonctionnalité et Ingénierie des Protéines'' de l'Université
de Nantes. Stéphane Téletchéa fournira les données brutes à traiter
et apportera son expertise dans le domaine des interaction
protéine-protéine.
Ce projet de recherche contient plusieurs étapes :
1. Dans un premier temps, ne prendre en compte que la chaîne
polypeptidique (c'est-à-dire la chaîne d'acides aminés) composant
chaque protéine. Le format de données sera ici simplement les deux
chaînes polypeptidique des deux protéines à tester pour prédire si
oui ou non elles interagissent entre elles. Il faudra proposer et
expérimenter un modèle de deep learning apprenant ces
interactions.
2. Avec les mêmes données, la seconde étape consiste à affiner la
prédiction pour non plus déterminer si deux protéines interagissent,
mais préciser à quel(s) niveau(x) dans leur chaîne polypeptidique
respective l'interaction a lieu, s'il y en a une.
3. Enfin, l'objectif ultime de ce projet de recherche est de
descendre au niveau atomique en prenant en compte la représentation
3D de la structure atomique de chaque protéine, allant bien au delà
de la simple chaîne polypeptidique. Un véritable challenge se pose
alors pour trouver un format de données convenable ainsi qu'un modèle
de deep learning capable de prédire où se situe l'interaction
au niveau atomique. Une telle méthode de prédiction serait inédite
dans le domaine, ce qui souligne le caractère ambitieux de ce projet
de recherche.