Event : Serious Games, réservez votre place


Formations au coeur des technologies

Essayer, tester, échanger les bonnes pratiques, partager les retours d'expériences, ...
toutes nos formations sont disponibles à distance (classes virtuelles) et en centre de formation (présentiel), au choix.
Vous pouvez même changer de modalité en cours de formation, si vous avez des contraintes : par exemple, commencer en présentiel et continuer les jours suivants à distance.
Les outils pédagogiques et l'infrastructure de travaux pratiques mis à disposition sont accessibles depuis nos locaux, ou depuis votre entreprise ou votre lieu de télétravail, à volonté
N'hésitez pas à tester nos formations et nos serious games !

Formation : Machine Learning avec scikit-learn

Durée2 jours
Prix1 260 €
Code coursDS011
Inscription

Public:

Chefs de projet, data-scientists, souhaitant comprendre le fonctionnement de scikit-learn

Objectifs:

Mettre en oeuvre scikit-learn pour de l'apprentissage machine et l'analyse de données

Connaissances préalables nécessaires:

Connaissance de python et d'une bibliothèque de calcul telle que numpy ou pandas

Programme détaillé de la formation


(logo acroreadTéléchargez le programme) :
Présentation
Historique
Fonctionnalités
Lien avec Numpy et Scipy
Analyse des données et classification
Modèles: linéaires, quadratiques, descente de gradient
Recherche de clusters: modélisations, algorithmes, et méthodes d'évaluation
Réseaux de neurones
Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
Encodeurs
Filtres et ETL
Pré-traitement de données : standardisation, transformations non linéaires, discrétisation
Gouvernance des données. Qualité des données.
Transformation de l'information en donnée. Qualification et enrichissement.
Sécurisation et étanchéité des lacs de données.
Flux de données et organisation dans l'entreprise. De la donnée maître à la donnée de travail. MDM.
Mise en oeuvre pratique des différentes phases :
nettoyage,enrichissement,organisation des données.
Atelier : construction d'un système de détection de contours
Apprendre à mettre en place un modèle d'apprentissage simple
Les différentes méthodes : apprentissage supervisé, apprentissage automatique.
Algorithmes : régression linéaire, k-voisins,classification naïve bayésienne, arbres de décision, forêts aléatoires, ...
Atelier : classifieurs. scoring
APIs fournies en standard, modèles d'apprentissage
Projet scikit-learn : classification, régression, validation de modèles prédictifs.
Démonstrations avec les modèles fournis par scikit-learn
Positionnement et comparaison avec Keras, mxnet, caffe
Atelier : codage d'une reconnaissance d'animaux avec une forêt aléatoire
Choisir entre la régression et la classification en fonction du type de données
Présentation des types de données en entrées : données discrètes, données continues. Labelisation, mapping par fonction.
Comprendre les algorithmes : régression linéaire, k-moyennes, k-voisins, classification naïve bayésienne, arbres de décision, forêts aléatoires, ...
Critères de choix des algorithmes.
Atelier : construction d'un système décisionnel fondé sur des forêts aléatoires
Évaluer les performances prédictives d'un algorithme
Les courbes d'apprentissage. Définitions : AUC, courbes ROC.
Comprendre le principe des hyper-paramètres. Choix des hyper-paramètres.
Atelier : calcul et visualisation d'une matrice de confusion
Atelier : Visualisation de courbes d'apprentissage fonction des hyper-paramètres
Atelier : Visualisation d'une mise en sur-apprentissage
Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
Présentation de pyspark
Machine learning et deep learning
TensorFlow : principe de fonctionnement, plateformes supportées, distribution,

Modalités et délais d'accès
Méthodes mobilisées