Malheureusement cette offre n'est plus active

Stage de recherche R&D HPC H/F : Implémentation efficace et scalable d'un modèle PGAS avec le support d'exécution MPI à Grenoble

Description du poste

Atos est un leader international de la transformation digitale avec environ 100 000 collaborateurs dans 72 pays et un chiffre daffaires annuel de lordre 12 milliards deuros. Numéro un européen du Big Data, de la Cybersécurité, des supercalculateurs et de lenvironnement de travail connecté, le Groupe fournit des services Cloud, solutions dinfrastructure et gestion de données, applications et plateformes métiers, ainsi que des services transactionnels par lintermédiaire de Worldline, le leader européen des services de paiement. Grâce à ses technologies de pointe et son expertise digitale & sectorielle, Atos accompagne la transformation digitale de ses clients dans les secteurs Défense, Finance, Santé, Industrie, Médias, Énergie & Utilities, Secteur Public, Distribution, Télécoms, et Transports. Partenaire informatique mondial des Jeux Olympiques et Paralympiques, le Groupe exerce ses activités sous les marques Atos, Atos Consulting, Atos Worldgrid, Bull, Canopy, Unify et Worldline. Atos SE (Societas Europea) est une entreprise cotée sur Euronext Paris et fait partie de lindice CAC 40. Pour plus dinformation : fr.atos.net

 

Le centre de recherche et developpement de ATOS Big Data and Security Service Line, basé en France (Grenoble, Paris), USA (Phoenix), Inde (bengalore) and Brésil ( Petropolis), a pour objectif de:

  • développer des produits innovants pour les solutions HPC (High Performance Computing), HPDA (High Performance Data Analysis) et Big Data
  • préparer les ruptures technologiques pour, demain, atteindre l’Exascale
  • faciliter/démocratiser un accès aux infrastructures et aux technologies HPC à des entreprises utilisatrices de composants BigData

L’échelle exaflopique implique une explosion des performances, du nombre de nœuds et de cœurs, des volumes de données et des mouvements de données. A une telle échelle, l’optimisation du réseau qui constitue l’armature du système devient un ingrédient majeur de la performance globale. L’interconnect va être l’une des technologies clés dans les systèmes exaflopiques. C’est pourquoi la clé de voûte de l'exascale de Bull est le développement d’une nouvelle génération d’interconnect propriétaire : Bull eXascale Interconnect[1].

Description du sujet

Dans le cadre du projet BXI, l'équipe « Runtimes and Tools for Users » (RT4U) de la R&D ATOS développe et optimise les supports d'exécution d'applications parallèles dans le domaine du calcul intensif. En particulier, l'équipe contribue activement au développement de la bibliothèque OpenMPI[2], qui implémente le standard MPI[3], pour le calcul distribué sur supercalculateurs dotés de réseaux rapides tels qu'InfiniBand ou le nouvel interconnect BXI développé par Bull.

Les primitives matérielles BXI implémentent la bibliothèque de programmation réseau Portals4[4], qui permet une correspondance facilitée avec les modèles de programmation de type PGAS (Partitioned Global Address Space). Cette correspondance permet d’implémenter de manière performante des modèles PGAS tout en profitant des atouts de l’implémentation OpenMPI, comme les communications collectives.

Cependant, il est discuté dans la littérature de problématiques liées au standard MPI lui-même, qui limite l’utilisation des modèles PGAS à leur plein potentiel dans le cadre applicatif. Différentes solutions sont proposées dans la littérature pour étendre l'API du standard MPI afin d’obtenir la scalabilité des performances du modèle PGAS avec MPI. Dans le cadre de ce stage Recherche, l'étudiant explorera la faisabilité de cette solution dans OpenMPI comparativement aux solutions de l'état de l'art. L'étudiant implémentera dans OpenMPI la solution retenue et évaluera les performances de sa proposition pour des applications correspondant aux besoins applicatifs réels sur différents interconnects (InfiniBand, BXI).

Mots-clés : parallélisme, calcul distribué, réseaux rapides, PGAS, MPI.

Références :

[1] ‘Bull – Bull eXascale Interconnect’, available at : https://bull.com/fr/bull-exascale-interconnect/
[2] Gabriel, Edgar, et al. ‘Open MPI: Goals, concept, and design of a next generation MPI implementation.’ European Parallel Virtual Machine/Message Passing Interface Users’ Group Meeting. Springer Berlin Heidelberg, 2004.
[3] ‘MPI : A Message passing Interface standard.’ June 4, 2015, available at : http://mpi-forum.org/docs/mpi-3.1/mpi31-report.pdf
[4] Barrett, Brian W., et al. ‘The Portals 4.0 network programming interface.’ Sandia National Laboratories, November 2012, Technical Report SAND2012-10087 (2012).

Dun niveau Bac +5, de nature curieuse et imaginative, vous évoluerez dans un environnement Linux.

Compétences demandées :

  • C/C++,
  • MPI,
  • Programmation parallèle,
  • Git,
  • Environnement Unix/Linux,
  • Anglais technique

Serait un plus :

  • Infiniband,
  • slurm,
  • Développement en environnement opensource,
  • Modèle de programmation pgas

Durée du stage : 6 mois

 

Chez Atos la diversité est au cœur de notre politique RH. C'est pourquoi Atos a mis en place un accord relatif à l’égalité professionnelle entre les hommes et les femmes. Par ailleurs, nos métiers sont tous accessibles aux personnes en situation de handicap, et ce quelle que soit la nature de leur handicap.

Date de publication

26-03-2024

Informations supplémentaires

Statut
Inactif
Lieu
Grenoble
Permis de conduire FR/EU exigé
Non
Voiture exigée
Non
Lettre de motivation exigée
Non
Langues
Français