Stage : Post-doc H/F -Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique
Le projet s'inscrit dans un programme transverse entre plusieurs laboratoires du CEA : le LM2S, le LI3A et le LGLS. Le laboratoire de modélisation et simulation de systèmes (LM2S) possède une expertise transverse en statistique à l'aide notamment d'approches bayésiennes et de méthodes Monte Carlo. Le laboratoire d'Intelligence Artificielle et Apprentissage Automatique (LI3A) travaille au développement et au transfert industriel de technologies de pointe en IA. Dans le cadre d'applications métiers dans le domaine énergétique, le LGLS développe pour les besoins des unités du CEA ou de ses partenaires dans des domaines scientifiques très variés : mécanique des fluides, neutronique, mécanique, soudage, matériaux, chimie, énergétique, technico-économique.
Mathématiques, information scientifique, logiciel
Post-doctorat
Post-doc H/F -Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique
Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique
12 mois
Dans de nombreuses disciplines scientifiques, de la physique des particules à la cosmologie, en passant par la biologie moléculaire et l'épidémiologie, il est aujourd'hui usuel de développer des outils de simulations complexes afin de décrire des phénomènes d'intérêt. Ces modèles basés sur la simulation sont souvent stochastiques (Monte Carlo) et comportent de multiples paramètres d'entrée. Alors que l'objet premier de la simulation stochastique est de pouvoir générer des données à partir d'une configuration de paramètres (simulation forward), son intérêt pratique réside fréquemment dans le problème inverse : déterminer une configuration de paramètres du modèle permettant de générer des données suffisamment proches de celles observées dans la Nature. La connaissance de ces paramètres peut alors représenter l'objectif de l'étude ou servir à la calibration du simulateur en vue d'analyses ultérieures. Or, la résolution d'un tel problème non linéaire et très indirect est en général une tâche ardue.
Au cours de ce projet, nous proposons de développer un outil numérique capable d'adopter le paradigme bayésien pour la résolution de ce problème inverse afin de caractériser l'ensemble des solutions via leur distribution a posteriori. Cette dernière est déterminée à partir d'une loi a priori sur les paramètres – traduisant notre degré de confiance initial sur leur gamme plausible – qui est mise à jour au vu des observations via leur vraisemblance – i.e. leur densité de probabilité –. Cependant, cet objectif se heurte ici à une difficulté fondamentale : on ne dispose pas de l'expression analytique de la vraisemblance dans le contexte de la simulation stochastique.
Cet obstacle majeur semble remis en question par l'émergence de modèles permettant l'estimation d'une densité de substitution des données simulées issus des avancées dans le domaine de l'Intelligence Artificielle (IA) non supervisée. En effet, la modélisation de densités de probabilité complexes est aujourd'hui un enjeu majeur dans le domaine du deep learning. Elle est par exemple au cœur des modèles génératifs profonds dont les Variational Auto-Encoder et les Generative Advsersarial Networks sont parmi les plus célèbres et étudiés. Dans le cadre de ce projet, les modèles type Normalizing Flows, Mixture Density Networks, Autoregressive Models seront plus adaptés à la résolution de problèmes inverses : ils permettent de calculer explicitement la densité (conditionnelle) normalisée ainsi que de générer efficacement des échantillons selon la loi de distribution apprise.
Ce projet vise donc la mise en commun du paradigme bayésien, de l'IA générative et de la simulation stochastique qui laisse ainsi envisager l'apparition d'une nouvelle génération d'outils d'analyse, de synthèse et de calibration pour les problématiques scientifiques et techniques adossées à des modèles Monte Carlo.
Doctorat en sciences de l'informatique ou physique théorique ou apprentissage statistiqueLe sujet s'inscrivant dans un programme de recherche transverse, le post-doctorant devra travailler aux interfaces de plusieurs domaines complémentaires. Pour cela, il bénéficiera au CEA d'un encadrement opéré par plusieurs chercheurs. Le candidat pourra présenter un profil en sciences de l'informatique ou en physique théorique et posséder de solides notions en statistiques mathématiques et modélisation bayésienne.
19-03-2024
Sélectionnez le secteur qui vous intéresse ci-dessous et n'oubliez pas votre adresse email!