Hadoop


Le projet hadoop regroupe un ensemble d'outils permettant d'exploiter des volumes importants de données : système de stockage, outils d'extraction, de conversion (ETL), d'analyse, systèmes d'organisation des tâches, interfaces de pilotage, etc ...HDFS pour le stockage, Yarn pour la répartition de tâches, Pig pour simplifier l'écriture de tâches MapReduce, ...

Les différents ateliers permettent de comprendre l'écosystème Hadoop, de savoir installer et configurer les outils, de développer avec MapReduce dans l'environnement hadoop.