Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : Hadoop : l'écosystème

Durée1 jour
Prix800 €
Code coursCB030
Dates13 mai
2 septembre
25 novembre

(cliquez sur une date pour vous inscrire)

Public:

Chefs de projets, développeurs, et toute personne souhaitant comprendre les mécanismes Hadoop et le rôle de chaque composant.

Objectifs:

Faire le point sur les différents éléments de l'écosystème Hadoop et leurs rôles respectifs. Comprendre l'architecture des applicatifs hadoop et savoir quels sont les apports et les cas d'usage des solutions hadoop.

Connaissances préalables nécessaires:

Connaissances générales des systèmes d'information.

Programme détaillé de la formation


(logo acroreadTéléchargez le programme) :
Introduction
Rappels sur NoSQL. Le théorème CAP. Historique du projet hadoop. Fonctionnalités : stockage, outils d'extraction, de conversion, ETL, analyse, ... Exemples de cas d'utilisation sur des grands projets. Les principaux composants : HDFS pour le stockage et YARN pour les calculs. Les distributions et leurs caractéristiques (HortonWorks, Cloudera, MapR, EMR, Apache, ...)
L'architecture
Terminologie : NameNode, DataNode, ResourceManager. Rôle et interactions des différents composants. Présentation des outils d'infrastructure : ambari, avro, zookeeper;de gestion des données : pig, oozie, tez, falcon, sqoop, flume;d'interfaçage avec les applications GIS;de restitution et requêtage : webhdfs, hive, hawq, impala, drill, stinger, tajo, mahout, lucene, elasticSearch, kibana
Les architectures connexes : spark, cassandra
Exemples interactifs
Démonstrations sur une architecture Hadoop multi-noeuds. Mise à disposition d'un environnement pour des exemples de calcul.
Atelier : intégration de données avec Flume, calculs map/reduce avec Pig, Hive, et Impala.


Applications
Cas d'usages de hadoop. Calculs distribués sur des clusters hadoop.

Déroulé pédagogique
Modalités et délais d'accès
Méthodes mobilisées

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr
Calendrier
Code cours : CB030

Contenu de la formation
Hadoop : l'écosystème:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours

Note moyenne des participants à la formation Hadoop : l'écosystème

4.2/5




Version du document : R006
Date de mise à jour du document : 2024/01/06