Développement d'une nouvelle plateforme web pour la linguistique de corpus, alliant la cartographie interactive (OpenLayers), le multimédia (vidéos H264 en adaptative streaming), et les dialectes occitans... C'est l'offre de stage idéale pour un étudiant qui souhaiterait s'initier à de nouvelles technologies ou parfaire son panel de compétences en développement web.
L'objectif de ce stage est la création d'une nouvelle plateforme web, aux standard actuels (HTML 5, CSS 3, Unicode) ; alliant la cartographie (webmapping) et le multimédia (vidéos diffusées en adaptative streaming) de manière interactive (exemple : un clic sur une phrase dans un texte affiché sur la page web déclenche la lecture de la phrase en question au sein de la vidéo, et l'affichage, sur la carte, du lieu où cette vidéo a été enregistrée ; et réciproquement, au fur et à mesure de la lecture de la vidéo les phrases du texte sont surlignées les unes après les autres).
20-03-2024
Au sein du laboratoire BCL, le THESOC (Thesaurus Occitan) est développé depuis 1992. Il s'agit de LA base de données de référence sur les dialectes occitans (vocabulaire, phonétique, et syntaxe), avec plus de 1,2 millions d'entrées lexicales, géolocalisées sur plus de 850 communes du sud de la France, mais aussi des illustrations et des centaines d'heures d'enregistrements audio et vidéo en occitan, ainsi que les données issues des atlas linguistiques de la France par régions. Actuellement, seule une toute petite partie de ces données est disponible en ligne, sur un site web aux fonctionnalités très limitées.
Sélectionnez le secteur qui vous intéresse ci-dessous et n'oubliez pas votre adresse email!