Projet Big Data

Objectif

Réalisation d'un système de traitement de données de type "Big Data" sur un cluster « mobile »

Matériel

16 Odroids
16 disques SSD 220G
Switch réseau, 1Gb/s par Odroid
5V-60A par Odroid

La ferme est hébergée dans des cubes en plexiglass transparent pour être visible de l'extérieur. Des ventilateurs la refroidissent en permanence.

Contraintes

Données distribuées
Calculs distribués
Resistance aux pannes
Calculs rapides

Mise en oeuvre technique

Les Odroids

Modèle: HC1
8 coeurs à 2 GHz
Processeur ARM
Ventilation externe et contrôle de la température
Linux + JVM pour Spark et Cassandra

Supervision

Les données sont remontées du cluster via SSH et JMX, puis affichées sur une console de supervision.

Données utilisées

Les données utilisées pour la démonstration sont les informations concernant les positions de satellites au cours du temps fournies par le NORAD.

Elles sont importées brutes dans un lac primaire de données Cassandra, puis transformées pour être rangées en tables métiers suivant les besoins. Les calculs sont réalisés dessus par Spark au bout de la chaîne de traitement.

Stockage

Base de données Cassandra
Stockage clé-valeur
La clé détermine la machine de stockage
Pas de noeud "master"
Réplication automatique des données

Calculs distribués

Avec Spark:

Un master et N workers
Les opérations classiques sont effecutées: filter, map, reduce

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr

Calendrier

Nos promotions
30% de remise sur le tarif catalogue

BigData supervision:Grafana Kibana Graphite Prometheus	du 6 au 8 novembre
IA - Deep Learning : tensorflow, Caffe, Pytorch	du 4 au 6 novembre
Dataiku DSS	du 12 au 13 novembre
Neo4j : graphes et analyse	du 14 au 15 novembre
Utilisation de Kibana	du 21 novembre
SQL pour non informaticien	du 25 au 27 novembre
Les architectures et infrastructures pour le Bigdata	du 26 au 27 novembre
Spark : développer des applications pour le Big Data	du 27 au 29 novembre
Apache Kafka	du 2 au 4 décembre
Architecture cloud d'entreprise	du 3 au 5 décembre
Gestion de Parc avec GLPI	du 4 au 6 décembre
Python avancé pour data-scientists	du 9 au 12 décembre
Le langage Go	du 9 au 12 décembre
Openstack : installation et configuration	du 9 au 11 décembre
BigData : intégration SQL, Hive, SparkDataFrames	du 12 au 13 décembre
Développement web avec Django	du 16 au 18 décembre
Zabbix administration	du 16 au 18 décembre
Elasticsearch : indexation de contenu	du 17 au 18 décembre
ElasticStack pour administrateurs	du 19 au 20 décembre

Intelligence artificielle
Intelligence artificielle : Etat de l'art (OpenAI, Google Gemini, AWS
IA - Deep Learning : tensorflow, Caffe, Pytorch
IA - langage : NLP, traduction, analyse
IA - traitement images : Keras, Pytorch, OpenCV
IA - conversationnel : Chatbot, ChatGPT, Google Gemini, AWS Lex
IA - analyse, génération de sons : WaveNet, AWS Transcribe
IA - analyse et production de code informatique
IA - Génération de modèles
IA - programmation quantique
IA - Gestion de modèles
Data-science
Machine learning, l'état de l'art
Machine Learning avec scikit-learn
Python avancé pour data-scientists
Spark ML
Dataiku DSS
Neo4j : graphes et analyse
Les fondamentaux de l'analyse statistique avec R
Data-engineering
Spark : développer des applications pour le Big Data
Dask : mise en oeuvre, programmation
Talend : intégration de données
Apache Kafka
Hadoop : développement
ElasticStack : présentation
Elasticsearch : indexation de contenu
BigData : intégration SQL, Hive, SparkDataFrames
Big Data
Etat de l'art du BigData
Les architectures et infrastructures pour le Bigdata
NoSQL : les fondamentaux
Hadoop, l'écosystème
NoSQL : Apache Cassandra , mise en oeuvre et administration
NoSQL : MongoDB, mise en oeuvre et administration
Hadoop : Hadoop HBase : mise en oeuvre et administration
Hadoop : administration cloudera
ElasticStack pour administrateurs
SQL
SQL pour non informaticien
SQL, les fondamentaux
MySQL prise en main et administration
PostgreSQL administration
PostgreSQL : administration avancée
MariaDB Administration
Infrastructures techniques/Cloud
Cloud : technologies et enjeux
Architecture cloud d'entreprise
Openstack : installation et configuration
Openstack : IaC avec Heat, Terraform
CloudStack : mise en oeuvre
Stockage distribué avec Ceph
Infrastructures techniques/Orchestration
Etat de l'art : solutions d'orchestration
Ansible : industrialiser les déploiements
Puppet : automatiser la gestion des configurations
Chef : automatiser la gestion des serveurs
Terraform : orchestrer la configuration de votre infrastructure
Infrastructures techniques/Virtualisation
Virtualisation avec KVM
Virtualisation avec lxc
Docker : créer et administrer des conteneurs virtuels d'applications
Kubernetes : optimisation conteneurs
Réseaux virtuels avec OpenvSwitch
Infrastructures techniques
Gestion de Parc avec GLPI
Serveur web Apache
Serveur Nginx
Unix Linux introduction
Le Shell
Administration Linux
Administration avancée Linux
Haute disponibilité Linux
Blockchain : mise en pratique
Shibboleth : installation, configuration
Supervision infrastructures
Zabbix administration
Supervision avec prometheus et Grafana
BigData supervision:Grafana Kibana Graphite Prometheus
Mise en oeuvre SNMP
Développement
Git : Gestion du contrôle de versions
Jenkins : intégration continue
Programmation Python
Python avancé : programmation scientifique
Python : Jupyter Notebook
Le langage Go
Programmation Scala
Programmation Perl
Programmation PHP
Concepts objets et programmation Java
Programmation avancée Java
Visualisation de données
Qlik Sense : create visualizations
Tableau Desktop : exploitation de données
Utilisation de Kibana
Développement web avec Django
Concevoir une interface graphique en Python
Visualisation avancée de données avec Python
Developpement Web avec Bootstrap
Embarqué et robotique
Initiation au langage C
Perfectionnement en langage C
Programmation système en langage C
Programmation noyau drivers C
IoT - Etat de l'art de l'internet des objets connectés
Conception robotique avec ROS
Computer Vision : OpenCV, Jetson
Simulation avec Gazebo
Cycles certifiants métiers
Cycle certifiant Architecte BigData
Cycle certifiant Développeur BigData
Cycle certifiant Administrateur BigData
Cycle certifiant Développeur robotique
Serious Games
Serious Game : architecture BigData
Serious Game : supervision infrastructure BigData
Serious Game : implémentation réseau de neurones
Serious Game : dialoguer avec votre assistant IA préféré
Serious Game : création d'un assistant IA

Formations au coeur des technologies