Postuler maintenant!

Stage Spark HPDA: Intelligence Artificielle & Supercalculateurs pour le Big Data H/F à Grenoble

Grenoble | Isère

Description du poste

 

Atos est un leader international de la transformation digitale avec environ 100 000 collaborateurs dans 72 pays et un chiffre daffaires annuel de lordre 12 milliards deuros. Numéro un européen du Big Data, de la Cybersécurité, des supercalculateurs et de lenvironnement de travail connecté, le Groupe fournit des services Cloud, solutions dinfrastructure et gestion de données, applications et plateformes métiers, ainsi que des services transactionnels par lintermédiaire de Worldline, le leader européen des services de paiement. Grâce à ses technologies de pointe et son expertise digitale & sectorielle, Atos accompagne la transformation digitale de ses clients dans les secteurs Défense, Finance, Santé, Industrie, Médias, Énergie & Utilities, Secteur Public, Distribution, Télécoms, et Transports. Partenaire informatique mondial des Jeux Olympiques et Paralympiques, le Groupe exerce ses activités sous les marques Atos, Atos Consulting, Atos Worldgrid, Bull, Canopy, Unify et Worldline. Atos SE (Societas Europea) est une entreprise cotée sur Euronext Paris et fait partie de lindice CAC 40. Pour plus dinformation : fr.atos.net

 

Contexte général

ATOS BDS R&D développe, en méthode agile (SCRUM), une suite logicielle intégrée pour le support d'applications Big Data d'analyse de données et cognitives haute performance. Cette suite comprend des outils pour accélérer le développement et le déploiement de telles applications, à travers un catalogue de composants logiciels optimisés et de blueprints et à travers un studio permettant de construire des applications en mode self-service en assemblant et spécialisant des éléments de ce catalogue. Ce studio s'appuie sur un orchestrateur prenant en charge le cycle de vie des applications ainsi construites, de l'allocation de ressources sur les infrastructures de déploiement jusqu'à l'installation des logiciels et à leur démarrage. Le déploiement d'applications du domaine de l'IA ou du Big Data, fortement consommatrices en ressources de calcul, est pris en charge de façon optimale, sur tout type de Cloud, et en particulier sur des infrastructures de type HPC, prenant en compte les besoins en terme de mémoire, CPU, GPU,FPGA...

Contexte du stage

Que signifie HPDA ?
HPDA pour High Perfomance Data Analysis est une mouvement assez récent de l'informatique moderne visant à rapprocher (ou plutôt à réconcilier) deux courants historiques divergents mais ayant pour objectif commun d'améliorer le temps de résolution des problèmes complexes (simulation moléculaire, requêtage sur des bases de données de plusieurs pétaoctets ...).

D'un côté, il y a ceux qui pour atteindre cet objectif ont misé sur l'infrastructure(hardware) la plus puissante possible aboutissant ainsi à la fabrication de monstres de puissance tel que le Sunway TaihuLight ( l'ordinateur le plus puissant au monde) capables d'exécuter 796 * 2^50 opérations par seconde:

De lautre, ceux qui ont opté pour des optimisations logicielles ( software) en exploitant des infrastructures normales (commodity hardware) .Ce courant a abouti à la naissance de nombreux frameworks de stockage mais aussi de calcul tel que Apache Spark qui a permis en 2014 déjà de de traiter 1,42 TB/min :

Les cas d'utilisation n'étant pas les mêmes: les supercalculateurs étant le plus souvent destinés aux grosses simulations(exemple Météo France: ) ou dans la recherche fondamentale tandis que les frameworks comme Spark sont eux beaucoup plus utilisés par
les entreprises classiques et les géants du web (GAFA).

Pourquoi un rapprochement entre ces deux courants ?

A priori, il n'y a pas de raison à celui-ci car les cas d'utilisation semblent distincts. C'était sans
compter le renouveau de l'intérêt pour l'Intelligence Artificielle(IA) provoqué par l'explosion des
données à disposition des entreprises (big data). Seulement, les algorithmes permettant de créer des IA (deep learning) sont extrêmement gourmands en ressources(GPU le plus souvent) d'où le besoin pour des entreprises traditionnelles d'avoir accès à de grosses puissances de calcul.

Mission

L'objectif ce stage est de faire de toi un data hero grâce au composant Spark HPDA que tu développeras et ainsi d'octroyer à 1 individu lambda des superpouvoirs lui permettant de s'essayer à l'IA en quelques clics.


Pour cela,tu seras amené à:
* Développer une connaissance approfondie de Spark(most big data popular project)
* Développer une connaissance approfondie du fonctionnement des conteneurs (docker)
* Acquérir les notions de base sur les supecalculateurs/cloud(Amazon & Openstack)
* Acquérir les notions essentielles sur le deep learning
* Travailler au sein d'une équipe en mode Agile Scrum & DevOps
* Travailler sur un cas d'utilisation avec des données provenant d'Amazon
* Collaborer avec l'équipe en charge du développement d'un modèle de deep learning pour la reconnaissance
d'images
* Soumettre une présentation à 1 conférence professionnelle selon l'avancement des travaux

 

* Tu es en dernière année décole dingénieur/master
* Tu es motivé par les problématiques autour Big Data
* Tu as des connaissances de base concernant Hadoop et/ou Spark .
* Tu as des connaissances générales sur le Cloud/DevOps
* Tu nas pas de soucis à travailler en environnement Linux et écrire des scripts
* Tu peux lire/écrire des documents en anglais
* Tu fais preuve de curiosité, d'autonomie et d'esprit d'innovation
* Tu as déjà travaillé sur des projets scolaires/stages de développement

Chez Atos la diversité est au cœur de notre politique RH. C'est pourquoi Atos a mis en place un accord relatif à l’égalité professionnelle entre les hommes et les femmes. Par ailleurs, nos métiers sont tous accessibles aux personnes en situation de handicap, et ce quelle que soit la nature de leur handicap.

Date de publication

31-10-2017

Plus d'Informations

Lieu
Grenoble
Permis de conduire FR/EU exigé
Non
Voiture exigée
Non
Lettre de motivation exigée
Non