Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : Séminaire BigData : concepts et enjeux

Durée1 jour
Prix690 €
Code coursCB000
Dates 15 novembre

(cliquez sur une date pour vous inscrire)

Public:

Chefs de projets, architectes, data-scientists, et toute personne souhaitant comprendre les impacts du BigData sur l'entreprise au niveau du traitement des données, des architectures, de l'organisation.

Objectifs:

Comprendre les concepts et les apports du BigData, les impacts sur l'organisation de l'entreprise.

Connaissances préalables nécessaires:

Il est demandé aux participants d'avoir une bonne culture générale sur les systèmes d'information.

Validation des pré-requis

Validation des attentes

Programme détaillé de la formation


(logo acroreadTéléchargez le programme) :
IntroductionA l'origine du BigData : traitement de volumes importants de données non structurées,
traitements optimisés de flux de données au fil de l'eau,
liés aux nouvelles technologies et aux nouveaux usages.
Domaines concernés : recherche scientifique, médical, e-commerce, sécurité, prédictif, ...
Exemples : lutte contre la criminalité, fraude, santé, ressources énergétiques
Apports des évolutions techniques sur différents aspects : stockage, indexation/recherche, calcul.
Concepts clés : ETL, Extract Transform Load, CAP, 3V, 4V, données non structurées, prédictif, Machine Learning.
Quelques applications : Amazon Rekognition, Polly,
Le positionnement des technologies de cloud, BigData et noSQL, de data-mining. Eléments d'architecture.
Gouvernance des données :
importance de la qualité des données, fiabilité, durée de validité, sécurité des données
Aspects législatifs : sur le stockage, la conservation de données, etc ...
sur les traitements, la commercialisation des données, des résultats
Stockage distribué Caractéristiques NoSQL
Les différents modes et formats de stockage. Besoin de distribution.
Définition de la notion d'élasticité.
Principe du stockage réparti, définitions : réplication, sharding, gossip protocol, hachage,
Systèmes de fichiers distribués : GFS, HDFS, Ceph
Les bases de données : Cassandra, HBase, MongoDB, Accumulo,CouchBase, Riak, BigTable, ..
Calcul et restitution.Apport des outils de calculs statistiques
Langages adaptés aux statistiques, liens avec les outils BigData.
Outils de calcul et visualisation :
R, SAS, Spark, Tableau, QlikView, ...
Caractéristiques et points forts des différentes solutions.
EvolutionsLiens vers les nouveaux métiers : Hadoop scientists, Data scientists, CDO.
Analyse des données au service de l'entreprise
Rôle de la DSI dans la démarche BigData.
Ouverture sur l'OpenData : principe, la démarche publique, les licences.
Exemple : portail data.gouv.fr
Les offres Saas BigData comme Google BigQuery.
Les limites. Les nouveautés annoncées.
Calculs distribués, machine learning, I.A.

Modalités et délais d'accès
Méthodes mobilisées

Pythagore-F.D.

01 55 33 52 10
pfd@pythagore-fd.fr
Calendrier
Code Cours:CB000

Contenu de la formation
Séminaire BigData : concepts et enjeux:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours