Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
Tarif |
A partir de 2 050,00 € |
Durée | 3 jours ( 21 heures ) |
Modes |
|
Sessions |
Tarif |
A partir de 2 050,00 € |
Durée | 3 jours ( 21 heures ) |
Modes |
|
Sessions |
Cette formation en Big Data présente le framework Spark de calcul distribué. Vous écrirez les tâches avec le langage Python en utilisant la bibliothèque PySpark. Vous utiliserez la bibliothèque Machine Learning MLlib ainsi que les technologies Spark SQL, Spark Streaming.
Introduction au big data
Environnements big data : Hadoop, Mapreduce, Spark, etc.
Découvrir l’environnement Spark
Utilisation Spark : Quels avantages ?
Comment installer Apache Spark
Quelle infrastructure pour utiliser Spark en entreprise ?
Les principes et fonctionnement de l’environnement Spark : RDD, DataFrame, DataSet…
Manipuler des données avec Python, Pyspark
Rappels sur Python et la manipulation des données
Utilisation de SparkSQL et des DataFrames pour manipuler des données
Bonnes pratiques de Spark pour la manipulation de volume important de données
Architecture et composants de la plateforme Hadoop
Chargement des données depuis Hadoop, depuis des fihiers csv…
Transformer des données (création de DataFrames, ajout de colonnes, filtres…)
Cas pratiques de chargement et de modifications de données avec PySpark
Comprendre MLlib avec les principaux algorithmes d’apprentissage et méthodes statistiques (régression, discrimination, foret aléatoires, etc.)
Utiliser spark.ml pour la machine learning
Traitement de données textuelles
Automatiser vos analyses avec des pipelines
Analyser en temps réel avec Spark streaming
Principe de fonctionnement
Présentation des Discretized Streams
Les différents types de sources
Manipulation de l’API
Comparaison avec Apache Storm
Cette formation ne nécessite aucun pré-requis.
Cette formation s’adresse à toute personne intéressée par la technologie Spark et sa mise en oeuvre avec le langage Python.
Tarif |
A partir de 2 450,00 € |
Durée |
5j / 35h |
Modes |
|
Tarif |
A partir de 800,00 € |
Durée |
2 jours |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
A partir de 1 900,00 € |
Durée |
2j / 14h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
Contacter l'organisme |
Durée |
2j / 14h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
A partir de 1 640,00 € |
Durée |
2j / 14h |
Modes |
|
Acquérir les compétences pour développer des programmes PL/SQL pour accéder aux bases Oracle et créer des procédures stockées et des fonctions pour une réuilisation maximale et une maintenance du code minimale et concevoir des applications modulaires avec des packages. Gérer la récupération des données pour les applications frontales et invoquer du SQL Dynamique natif pour créer du code de haut niveau.
Tarif |
Contacter l'organisme |
Durée |
3 jour(s) |
Modes |
|
Tarif |
A partir de 1 390,00 € |
Durée |
2j / 14h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
A partir de 4 100,00 € |
Durée |
5j / 35h |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
1j / 7h |
Modes |
|
Tarif |
A partir de 1 133,00 € |
Durée |
1 jour |
Modes |
|