Formation: Environnement R, analyse de données

Durée:3 jours
Prix: 1980 €
Code cours:CB052
Dates:
17 au 19 septembre
14 au 16 novembre

classe virtuelle
(cliquez sur une date pour vous inscrire)

Public:

Chefs de projet, data scientists, statisticiens, développeurs souhaitant comprendre les apports de R pour l'analyse des données, et savoir l'intégrer à un environnement Hadoop.

Objectifs:

Connaître les principales fonctions statistiques de R, et savoir utiliser des programmes R dans un environnement BigData, en s'appuyant sur le système distribué hdfs.

Connaissances préalables nécessaires:

Notions de calculs statistiques

Programme détaillé de la formation


(logo acroreadTéléchargez le programme) :
Présentation RLe projet R Programming
Calculs statistiques et génération de graphiques
Points forts de R Programming
Besoins du BigData
Positionnement R programming par rapport à Hadoop
Mise en oeuvre de RTravaux pratiques : installation et tests sur une plate-forme CentOS
Utilisation de R en mode commande.
Commandes de base. Syntaxe.
Opérations de base. Expressions.
Manipulations de nombres, vecteurs, tableaux, matrices.listes, etc ..
Tableaux et matricesDéclaration, dimensionnement, indexation.
Opérations de base : produit de tableaux, transposition, produits de matrices.
Matrices : équations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré, ...
Liste et DataFramesDéfinitions, cas d'utilisation.
Attachement, détachement. Chargement d'un dataframe. La fonction scan.
StatistiquesDistributions embarquées : uniforme, normale, poisson, exponentielle, ...
Calculs statistiques. Modèles statistiques.
Affichage en graphes, histogrammes.
Import/exportFormats texte, csv, xml, binaire, largeur fixe, images (jpeg, png). Encodage. Filtrage.
Importation SQL. Importation depuis un socket réseau.
Travaux pratiques : importation de données géodésiques et export au format Json
Intégration HadoopAssociation de la puissance du calcul distribué fourni par les outils hadoop
Différents moyens d'intégration :
sparkR, RHbase, RHDFS, RHadoop, rmr2 pour utiliser le système distribué hdfs depuis R, pour accéder à HBase depuis les programmes en R.
Transformation d'un dataframe R en un dataframe Spark.
Travaux pratiques avec Hadoop
Fonctions spécifiquesDéfinition de nouvelles fonctions. Appels. Passage d'argument.
Construction d'une bibliothèque.
Diffusion, installation avec R CMD INSTALL.
EvolutionsLes acteurs : IBM avec BigInsights, Revolution R avec ScaleR

Pythagore F.D.
01 55 33 52 10
pfd@pythagore-fd.fr

Nos centres de connexion
Centres de connexion
Calendrier
Code Cours:CB052

Contenu de la formation
Environnement R, analyse de données:

Accès à la liste des cours



Vous pouvez bien entendu composer votre programme personnel à partir de nos descriptifs de cours