Stage : Post-doc H/F -Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique à Saclay

Stage : Post-doc H/F -Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique

Description du poste

Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :. la défense et la sécurité. l'énergie nucléaire (fission et fusion). la recherche technologique pour l'industrie. la recherche fondamentale (sciences de la matière et sciences de la vie).Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.

Référence

2021-16311

Description de l'unité

Le projet s'inscrit dans un programme transverse entre plusieurs laboratoires du CEA : le LM2S, le LI3A et le LGLS. Le laboratoire de modélisation et simulation de systèmes (LM2S) possède une expertise transverse en statistique à l'aide notamment d'approches bayésiennes et de méthodes Monte Carlo. Le laboratoire d'Intelligence Artificielle et Apprentissage Automatique (LI3A) travaille au développement et au transfert industriel de technologies de pointe en IA. Dans le cadre d'applications métiers dans le domaine énergétique, le LGLS développe pour les besoins des unités du CEA ou de ses partenaires dans des domaines scientifiques très variés : mécanique des fluides, neutronique, mécanique, soudage, matériaux, chimie, énergétique, technico-économique.

Description du poste

Domaine

Mathématiques, information scientifique, logiciel

Contrat

Post-doctorat

Intitulé de l'offre

Post-doc H/F -Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique

Sujet de stage

Deep learning pour l'inférence bayésienne adossée à un simulateur stochastique

Durée du contrat (en mois)

12 mois

Description de l'offre

Dans de nombreuses disciplines scientifiques, de la physique des particules à la cosmologie, en passant par la biologie moléculaire et l'épidémiologie, il est aujourd'hui usuel de développer des outils de simulations complexes afin de décrire des phénomènes d'intérêt. Ces modèles basés sur la simulation sont souvent stochastiques (Monte Carlo) et comportent de multiples paramètres d'entrée. Alors que l'objet premier de la simulation stochastique est de pouvoir générer des données à partir d'une configuration de paramètres (simulation forward), son intérêt pratique réside fréquemment dans le problème inverse : déterminer une configuration de paramètres du modèle permettant de générer des données suffisamment proches de celles observées dans la Nature. La connaissance de ces paramètres peut alors représenter l'objectif de l'étude ou servir à la calibration du simulateur en vue d'analyses ultérieures. Or, la résolution d'un tel problème non linéaire et très indirect est en général une tâche ardue.

Au cours de ce projet, nous proposons de développer un outil numérique capable d'adopter le paradigme bayésien pour la résolution de ce problème inverse afin de caractériser l'ensemble des solutions via leur distribution a posteriori. Cette dernière est déterminée à partir d'une loi a priori sur les paramètres – traduisant notre degré de confiance initial sur leur gamme plausible – qui est mise à jour au vu des observations via leur vraisemblance – i.e. leur densité de probabilité –. Cependant, cet objectif se heurte ici à une difficulté fondamentale : on ne dispose pas de l'expression analytique de la vraisemblance dans le contexte de la simulation stochastique.

Cet obstacle majeur semble remis en question par l'émergence de modèles permettant l'estimation d'une densité de substitution des données simulées issus des avancées dans le domaine de l'Intelligence Artificielle (IA) non supervisée. En effet, la modélisation de densités de probabilité complexes est aujourd'hui un enjeu majeur dans le domaine du deep learning. Elle est par exemple au cœur des modèles génératifs profonds dont les Variational Auto-Encoder et les Generative Advsersarial Networks sont parmi les plus célèbres et étudiés. Dans le cadre de ce projet, les modèles type Normalizing Flows, Mixture Density Networks, Autoregressive Models seront plus adaptés à la résolution de problèmes inverses : ils permettent de calculer explicitement la densité (conditionnelle) normalisée ainsi que de générer efficacement des échantillons selon la loi de distribution apprise.

Ce projet vise donc la mise en commun du paradigme bayésien, de l'IA générative et de la simulation stochastique qui laisse ainsi envisager l'apparition d'une nouvelle génération d'outils d'analyse, de synthèse et de calibration pour les problématiques scientifiques et techniques adossées à des modèles Monte Carlo.

Profil du candidat

Doctorat en sciences de l'informatique ou physique théorique ou apprentissage statistiqueLe sujet s'inscrivant dans un programme de recherche transverse, le post-doctorant devra travailler aux interfaces de plusieurs domaines complémentaires. Pour cela, il bénéficiera au CEA d'un encadrement opéré par plusieurs chercheurs. Le candidat pourra présenter un profil en sciences de l'informatique ou en physique théorique et posséder de solides notions en statistiques mathématiques et modélisation bayésienne.

Date de publication

12-04-2021

Informations supplémentaires

Statut
Actif
Formation requise
Université
Lieu
Saclay
Heures de travail par semaine
4 - 40
Type de Contrat
Alternance/Apprentissage
Secteur
Autres
Permis de conduire FR/EU exigé
Non
Voiture exigée
Non
Lettre de motivation exigée
Non
Langues
Français

Offres d'emploi autres | Alternance/Apprentissage | Université

Postuler maintenant

Partager cette offre