Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : Hadoop Hortonworks : administration avec Ambari

Durée3 jours
Prix1950 €
Code coursCB031
Dates 18 au 20 octobre
20 au 22 décembre

(cliquez sur une date pour vous inscrire)

Public:

Chefs de projet, administrateurs et toute personne souhaitant mettre en oeuvre un système distribué avec Hadoop.Les travaux pratiques sont réalisés sur une distribution Hadoop Hortonworks.

Objectifs:

Connaître les principes du framework Hadoop et savoir l'installer, le configurer et l'administrer avec Ambari (tableaux de bord, supervision, gestion des services, etc ...)

Connaissances préalables nécessaires:

Connaissance des commandes des systèmes unix/linux et des bases TCP/IP

Validation des pré-requis

Validation des attentes

Programme détaillé de la formation


(logo acroreadTéléchargez le programme) :
IntroductionLes fonctionnalités du framework Hadoop. Les différentes versions.
Distributions : Apache, Cloudera, Hortonworks, EMR, MapR, DSE.
Spécificités de chaque distribution.
Architecture et principe de fonctionnement.
Terminologie : NameNode, DataNode, ResourceManager, NodeManager. Rôle des différents composants. Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce, Oozie, Tez, Pig, Hive, HBase, ...
Les outils Hadoop Infrastructure/Mise en oeuvre : Avro, Ambari, Zookeeper, Pig, Tez, Oozie. Vue d'ensemble. Gestion des données. Exemple de sqoop.
Restitution : webhdfs, hive, Hawq, Mahout, ElasticSearch ..
Outils complémentaires de traitement : Spark, SparkQL, Spark/ML, Storm, BigTop, Zebra; de développement : Cascading, Scalding, Flink; d'analyse : RHadoop, Hama, Chukwa, kafka
Installation et configurationInstallation en mode distribué. Configuration du cluster et de l'environnement, étude des fichiers de configuration :
core-site.xml, hdfs-site.xml, mapred-site.xml, yarn-site.xml et capacity-scheduler.xml
Création des users pour les daemons hdfs et yarn,droits d'accès sur les exécutables et répertoires.
Lancement des services.Démarrage des composants : hdfs, hadoop-daemon, yarn-daemon, etc ..
Gestion de la grappe, différentes méthodes :ligne de commandes, API Rest, serveur http intégré, APIS natives
Exemples en ligne de commandes avec hdfs, yarn, mapred. Présentation des fonctions offertes par le serveur http
Travaux pratiques : organisation et configuration d'une grappe hadoop
Administration HadoopOutils complémentaires à yarn et hdfs : jConsole, jconsole yarn. Exemples sur le suivi de charges, l'analyse des journaux.
Principe de gestion des noeuds.
Principe des accès JMX. Démonstration avec Prométheus.
Administration HDFS :présentation des outils de stockage des fichiers, fsck, dfsadmin. Mise en oeuvre sur des exemples simples de récupération de fichiers
Gestion centralisée de caches avec Cacheadmin. Déplacement d'un NameNode. Mise en mode maintenance.
Gestion de la file d'attente, paramétrage, capacity-scheduler.
Haute disponibilitéMise en place de la haute disponibilité sur une distribution Ambari.
Travaux pratiques : passage d'un système HDFS en mode HA
Explication/démonstration d'une fédération de cluster Hadoop.
Sécurité Mécanismes de sécurité et mise en oeuvre pratique de la sécurité avec Kerberos.
Travaux pratiques : mise en place de la sécurité Kerberos sur une distribution Ambari. Création des utilisateurs. Travaux sur les droits d'accès et les droits d'exécution. Impact au niveau des files de traitement Yarn.
Sécurisation de yarn avec les Linux Container Executor.
ExploitationInstallation d'une grappe Hadoop avec Ambari. Tableau de bord. Lancement des services. Principe de la supervision des éléments par le NodeManager.
Monitoring graphique avec Ambari. Présentation de Ganglia, Kibana.
Travaux pratiques : visualisation des alertes en cas d'indisponibilité d'un noeud. Configuration des logs avec log4j.

Modalités et délais d'accès
Méthodes mobilisées

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr
Calendrier
Code Cours:CB031

Contenu de la formation
Hadoop Hortonworks : administration avec Ambari:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours