Stage : Etude des communications collectives en contexte de déséquilibrage de charge
Le service ANL (Analyse, Numérique et Logiciels) est chargé de la conception, du développement, de la réalisation et de la maintenance des codes et d'outils de simulation numérique pour le calcul haute performance (HPC). Il est amené à réaliser des logiciels, des codes de simulations et de la R&D pour le programme simulation de la DAM.
Mathématiques, information scientifique, logiciel
Stage
Etude des communications collectives en contexte de déséquilibrage de charge
La programmation des supercalculateurs composés de nombreux nœuds de calcul impose l'utilisation de modèle de programmation à mémoire distribuée telle que Message Passing Interface (MPI). Parmi les modèles de communications proposées par MPI, les communications collectives permettent d'appliquer facilement un schéma complexe de communications. Ils peuvent être implémentés avec plusieurs algorithmes différents, montrant différents niveaux d'efficacité selon les cas d'utilisation. La plupart de ces algorithmes sont mis en place et évalués sur des tests équilibrés. Or, comme les codes de simulation représentent de nombreux types de comportements physiques, il est probable que différents processus MPI n'aient pas la même quantité de travail à réaliser. On parle alors de déséquilibre dans le programme parallèle.Ce stage propose d'étudier l'effet du déséquilibre sur les différents algorithmes de communications collectives présents dans plusieurs implémentations MPI.
6 mois
Dans ce stage, nous nous proposons d'étudier l'effet du déséquilibre sur les différents algorithmes de communications collectives présents dans plusieurs implémentations MPI. La plupart de ces algorithmes ayant été principalement mis en place pour des cas équilibrés, il est intéressant de vérifier si le meilleur algorithme équilibré et aussi le meilleur algorithme déséquilibré, ainsi que les effets de bord qu'un fort déséquilibre peut provoquer sur un algorithme de collective, voire sur une implémentation MPI en général.Dans un premier temps, le candidat devra se familiariser avec les implémentations MPI utilisées au CEA, et étudier les différents algorithmes de communications collectives utilisées dans ces implémentations.Ensuite, il devra mettre en place un ensemble de tests permettant de tester les différents algorithmes en présence de différents niveaux de déséquilibres.
BAC+5 (Master/Ingénieur) en InformatiqueAlgorithmique parallèleLangage CProgrammation MPIMaster 2
20-03-2024
Sélectionnez le secteur qui vous intéresse ci-dessous et n'oubliez pas votre adresse email!