Accueil > Forum TERATEC > Ateliers > Atelier 1

Forum TERATEC 2020
Mercredi 14 octobre - Ateliers techniques

Atelier 01 - de 09h00 à 10h30

Données satellite et environnement : du foisonnement des applications à l’émergence de réponses structurées
Présidé par Laurent Boisnard, Sous-directeur adjoint Observation de la Terre, CNES et François Robida, BRGM

Analyse de données scientifiques à l’échelle sur HPC ou dans le Cloud avec Pangeo
Par Guillaume Eynad-Bontemps, Responsable Centre de Calcul, CNES
et Tina Odaka, Ingénieur recherche et développement en traitement de larges jeux de données, IFREMER

Pangeo est à la fois une communauté scientifique et technique, un écosystème logiciel autour de Python, et une plateforme qui peut être déployée sur différentes infrastructures. Son but est de proposer des moyens permettant aux scientifiques et ingénieurs du monde entier de facilement analyser et post traiter les données issues de simulations HPC (modèles climatiques) ou de capteurs comme les satellites d’observation de la terre.
Dans cette présentation, nous verrons comment à travers les briques logicielles principales que sont Jupyter, Dask et Xarray, un chercheur va pouvoir analyser de gros volumes de données de manière interactive, en quelques lignes de codes.

Les briques logicielles principales seront abordées :

  • Jupyter est l’interface graphique, qui remplace avantageusement la ligne de commande.

  • Dask permet de distribuer les calculs et l’accès aux données sur plusieurs serveurs ou machines virtuelles.

  • Xarray donne une représentation haut niveau de la donnée scientifique multi dimensionnelle.

Nous présenterons également les principaux modes de déploiement d’une plateforme Pangeo : un ordinateur personnel, un hébergeur cloud ou un cluster de calcul de type HPC.
Enfin, nous montrerons l’utilisation de la pile Pangeo sur des cas concrets :

  • Une analyse multi temporelle sur des tuiles du satellite Sentinel 2, afin de suivre l’évolution d’un indice comme le NDVI (Indice de Végétation par Différence Normalisé),

  • Le calcul en quelque secondes de l’évolution du niveau des Océan à partir des données Aviso en distribuant ces traitements sur des centaines de cœurs de calcul.
Biographie  : Ingénieur recherche et développement en traitement de larges jeux de données chez IFREMER.  Après avoir obtenu son doctorat en co-tutelle (Allemagne et Japon), Tina a effectué son post-doc en traitement de données satellitaires et calcul HPC sur modèle océanique. Tina travaille depuis 2008 à l'IFREMER en tant qu'experte en calcul scientifique dans le domaine des sciences marines. Tina s'intéresse au workflow optimal des données au résultat ; à la fois pour les utilisateurs et l'utilisation de l'infrastructure. 
Biographie : Responsable du Centre de Calcul du CNES depuis un an, Guillaume est expert an traitement sur des volumes de données massifs. Il a dans le passé participé à la mise en place d’un cluster Hadoop et développé des algorithmes dessus. Il est également membre du comité de pilotage de Pangeo et un utilisateur actif de Dask.

Inscrivez-vous dès à présent et obtenez votre badge en cliquant ici

  • Le Forum TERATEC est strictement réservé aux professionnels.
  • Participation gratuite aux conférences et aux ateliers (sous réserve des places disponibles).
  • L'enregistrement en ligne est obligatoire.

Pour toute autre information concernant les ateliers techniques, prière de contacter :

Jean-Pascal JEGU
Tél : +33 (0)9 70 65 02 10 - Mob.: +33 (0)6 11 44 49 59
jean-pascal.jegu@teratec.fr
Campus TERATEC
2, rue de la Piquetterie
91680 BRUYERES-LE-CHATEL
France

© Teratec - Tous droits réservés - Mentions légales