Malheureusement cette offre n'est plus active

Orange Stagiaire - Data Scientist Traitement Automatique du Wolof H/F

Description du poste

Orange recherche ...

La Direction Data et IA est une nouvelle direction dont la principale mission est de faire d'Orange une entreprise « data driven », qui définit les standards du Groupe en matière de Data et IA, et qui facilite le développement des cas d'usage, des Produits et Services de données. Les services de traitement de la langue naturelle et de d'interaction langagière entrent dans ce cadre. Pour cela, elle réunit des effectifs d'équipes de différentes directions qui ont une expertise Data ou IA et travaille avec les entités opérationnelles qui portent les besoins de service.

Dans le contexte actuel de développement rapide de solutions de BOTS (assistants personnels automatiques), vous serez en charge de contribuer à l'optimisation des technologies de traitement de la langue impliquées dans la construction d'un bot vocal en langue wolof, en portant une attention particulière aux performances de la technologie de reconnaissance vocale développée par Orange. Ce projet fait l'objet d'un partenariat avec le pôle digital d'Orange Sénégal.
L'Afrique Subsaharienne est en grande attente de solutions technologiques vocales de qualité. Ceci tient à l'illettrisme (40% en moyenne selon l'UNESCO, et jusqu'à 75% pour certains pays du Sahel comme le Mali) comme à la barrière de la langue.
Dans ce contexte, les BOTS vocaux en langue sub-saharienne apparaissent comme un « facilitateur technologique » clé sur le périmètre Afrique, ouvrant l'accès à des populations de plusieurs centaines de millions de clients potentiels, illettrés, ne parlant que des langues locales. Le développement d'un BOT s'appuie sur plusieurs technologies : reconnaissance de la parole (de couverture de langue plus ou moins exhaustive), modélisation de la langue (compréhension, interprétation), gestionnaire de dialogue, génération textuelle et synthèse vocale (plus ou moins contextualisée) sont les briques de base nécessaires à la gestion de la composante langagière du BOT. Faisant appel à de bonnes compétences en informatique et en mathématique, le stage proposé ici porte sur l'optimisation de la chaine de traitement du Wolof, langue très majoritairement parlée au Sénégal, avec un focus particulier sur la brique de reconnaissance vocale. Pour cela, on utilisera la solution Cobalt, développée par Orange Labs, avec laquelle des essais préliminaires encourageants ont déjà été conduits.
Le stage a pour objectif de rendre la solution opérante dans un contexte de relation client orienté vers la présentation des offres grand public d'Orange Sénégal. Différents types de corpus (métier ou généralistes) seront mis à disposition.
Différentes questions seront adressées dans le cadre de ce stage, notamment :
- Quel mode de représentation de la langue est le plus adéquat à des fins de reconnaissance vocale dans un contexte dialogique spontané ?.
- Quel niveau de performance peut être atteint selon la quantité de données disponible ?.
- Quel compromis entre données métiers et données généraliste est souhaitable ?.
Ce travail est prévu en Bretagne, dans les locaux d'Orange Labs à Lannion, en étroite collaboration avec l'équipe en charge de Cobalt et avec le Plateau Digital d'Orange Sénégal situé à Dakar, porteur de la plateforme cible.

Vous êtes ...

De formation Bac +5 : Master ou Ecole d'ingénieur, avec une spécialité Data Science, vous êtes à la recherche d'un stage d'une durée de 6 mois débutant en janvier 2020.
Pour ce faire, vous devez :
- Être rigoureux-se ; disposer d'une bonne capacité d'analyse et d'un esprit critique.
- Maîtriser le wolof est un plus indéniable.

Le plus de l'offre :
Vous participerez à l'une des premières études sur les technologiques vocales en langue subsaharienne, avec l'ambition de maquetter un prototype de BOT vocal de relation client en Wolof.

Date de publication

20-03-2024

Informations supplémentaires

Statut
Inactif
Lieu
Orange
Type de Contrat
CDI - Temps plein
Secteur
Construction / BTP, Vente
Permis de conduire FR/EU exigé
Non
Voiture exigée
Non
Lettre de motivation exigée
Non