Malheureusement cette offre n'est plus active

Ingénieur.e sur l'étude de l'hybridation Reinforcement learning - Fuzzy Inference System pour la résolution de problèmes modélisés sous forme de Semi Markov Decision Process (H/F) Stage de 6mois à Palaiseau

4 - 40 heures par semaine

Description du poste

CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :

Le thème A2R cherche à hybrider les différentes technologies d'intelligence artificielle, notamment apprentissage statistique et modèles symboliques, pour améliorer la gestion des risques. Le but recherché est d'éviter une gestion de crise grâce à une gestion préalable des risques.

Une approche possible, pour s'attaquer à cette gestion des risques, est d‘avoir recours à un modèle symbolique (par exemple, un système à base de règles) reposant sur une expertise existante. Cette expertise étant humaine, elle est par définition faillible (incomplète, voir fausse). De plus, un changement de contexte peut rendre incorrectes des règles qui étaient correctes jusque-là. L'idée est donc d'hybrider les modèles d'IA symbolique - un système de règles construit à partir de l'expertise humaine - avec des technologies d'apprentissage pour en corriger les erreurs. L'état de l'art des travaux portant sur cette hybridation repose principalement sur des modélisations du problème sous forme de Markov Decision Process (MDP) dans lequel le temps est discrétisé par pas de temps constant.

Le but de ce stage est d'étudier les algorithmes qui cherchent à résoudre des problèmes modélisés sous forme de Semi MDP dans lesquels le temps n'est pas discrétisé en pas constants mais est considéré comme une dimension de la transition état-action. Le premier objectif est de maitriser cette modélisation en s'appropriant l'état de l'art et en y apportant un regard critique. Le deuxième objectif est d'implémenter un ou plusieurs algorithmes de l'état de l'art afin de pouvoir juger des performances et de les comparer. Enfin, le troisième objectif sera de proposer des améliorations pour améliorer l'état de l'art.

Dans ce contexte, vos missions seront les suivantes :
Se mettre à niveau sur l'apprentissage par renforcement (si nécessaire)

Se mettre à niveau sur la logique floue (si nécessaire)

S'approprier les Semi Markov Decision Process

Implémenter, comparer et analyser les différents algorithmes de l'état de l'art

Etudier les pistes d'amélioration de l'état de l'art

Proposer des perspectives

Présenter vos travaux en cours

Innovation, passion, ambition : rejoignez Thales et créez le monde de demain, dès aujourd'hui.

QUI ETES-VOUS ?
Etudiant.e en école d'Ingénieur.e ou formation équivalente vous préparez un Master 2 de Recherche en Intelligence Artificielle ?

Votre formation et vos différents stages vous ont permis d'acquérir les compétences suivantes :
Linux

Programmation orientée Objet

Python

Vous avez aussi idéalement développé des compétences en Logique Floue, Apprentissage par renforcement, SMDP, Git ?

Vous êtes curieux.se, raison qui vous pousse à effectuer votre stage de fin d'études dans le monde de la Recherche ?

Enfin vous souhaitez évoluer dans un milieu international et de ce fait avez un bon niveau d'anglais (Niveau B2 - C1 attendu) ?

Alors découvrez vite vos futures missions ! :)

QUI SOMMES-NOUS ?

Situé sur le campus de l'École polytechnique, au cœur du pôle scientifique et technologique d'envergure mondiale de Paris-Saclay, le site de Palaiseau regroupe les activités de Thales Research & Technology (TRT), le centre de recherche du Groupe, et de ThereSIS (THALES European REsearch center for Security & Information Systems) au service des activités mondiales du Groupe. Grâce à une politique de partenariat proactive avec le monde académique et un réseau international d'entreprises innovantes, nos équipes de recherche de TRT développent des technologies de rupture et celles de ThereSIS sont dédiées à la sécurisation des systèmes d'information, à l'ingénierie des systèmes complexes et aux technologies innovantes de la transformation numérique afin d'obtenir rapidement des résultats répondant à des demandes opérationnelles concrètes.

Dans ce cadre nous recherchons un.e :
Ingénieur.e sur l'étude de l'hybridation Reinforcement learning - Fuzzy Inference System pour la résolution de problèmes modélisés sous forme de Semi Markov Decision Process (H/F) Stage de 6mois
Basé.e à Palaiseau (91)

Date de publication

26-03-2024

Informations supplémentaires

Statut
Inactif
Formation requise
Université
Lieu
Palaiseau
Heures de travail par semaine
4 - 40
Type de Contrat
Job étudiant
Secteur
Autres
Permis de conduire FR/EU exigé
Non
Voiture exigée
Non
Lettre de motivation exigée
Non
Langues
Français

Palaiseau | Offres d'emploi autres | Job étudiant | Université