Le travail du stage consistera en la constitution d'une base d'apprentissage adaptée à l'apprentissage d'un tel modèle avec des images extraites de référentiels comme Birds of the World (dessins), le choix de codage et normalisation de ces données etc. en collaboration avec l'autre stagiaire sur le projet.
L'objectif serait ensuite de concevoir un modèle qui apprend une représentation continue qui peut avoir un sens pour les experts du domaine (biologique, paléontologique etc.) en intégrant dans l'apprentissage des représentations des contraintes à la fois sur l'aspect temporel (évolution) et sur la proximité génétique (ancêtres communs etc.). Les pistes à explorer sont une régularisation par fonction de coût ou l'utilisation de méthodes contrastives (faiblement supervisées) apprenant une "métrique" de similarité en présentant des paires ou triplet d'oiseaux appartenant à la même espèce ou non. Une des questions étudiées sera de savoir comment représenter certaines discontinuités, les relations hiérarchiques et les propriétés topologiques dans ce "manifold" (variété géométrique) appris par le réseau de neurones pour explicitement intégrer certaines contraintes.
Plus d'information ici https://perso.liris.cnrs.fr/mathieu.lefort/jobs/stage/Merle/sujet2.pdf