Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
À l'issue de cette formation Développement de scripts avec Apache Pig vous aurez acquis les connaissances et les compétences nécessaires pour :
Tarif |
A partir de 1 360,00 € |
Durée | 2 jours (14h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
Tarif |
A partir de 1 360,00 € |
Durée | 2 jours (14h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
Intégré à la suite Hadoop, Pig est une plate-forme de haut niveau permettant la programmation parallèle de tâches MapReduce tournant dans un cluster Hadoop. Utilisé le plus souvent pour charger des données via des fichiers HDFS ou pour gérer des échanges de données entre des applications tierces, Pig pour le big data comprend deux éléments-clé : un compilateur et un langage de script nommé Pig Latin.
Durant cette formation Développement de scripts avec Apache Pig vous comprendrez le fonctionnement de Pig, vous saurez développer des requêtes avec Pig Latin pour effectuer des transformations sur les données et des analyses de données. Pour finir vous saurez intégrer des données de différents formats.
Le projet Apache Pig, fonctionnalités, versions
Présentation de Pig dans l'écosystème Hadoop
Chaîne de fonctionnement
Comparatif avec l'approche Hive ou Spark
Rappels sur les commandes HDFS
Prérequis techniques, configuration de Pig
Travaux pratiques
Exécution : les différents modes : interactif ou batch
Principe de l'exécution de scripts Pig Latin avec Grunt
Modèles de données avec Pig
Intégration Pig avec MapReduce
Les requêtes Latin : chargement de données, instructions
Ordres de bases : LOAD, FOREACH, FILTER, STORE
Travaux pratiques
Création d'un ETL de base
Contrôle d'exécution
Groupements, jointures, tris, produits cartésiens
Transformation de base de la donnée
Découpages
Découpages sur filtres
Echantillonages
Filtres
Rangements avec rank et dense
Calculs : min/max, sommes, moyennes...
Travaux pratiques
Traitements de chaînes de caractères
Traitement de dates
Formats d'entrées/sorties
Interfaçage avro, json
Travaux pratiques
Chargement de données depuis HDFS vers HBase
Analyse de données Pig/Hbase
Restitution Json
Extension du Pig Latin
Création de fonctions UDF en Java
Intégration dans les scripts Pig
Travaux pratiques
Utilisation de Pig Latin depuis des programmes Python
Execution de programmes externes, streaming
Tarif |
A partir de 1 995,00 € |
Durée |
3j / 21h |
Modes |
|
Tarif |
A partir de 1 300,00 € |
Durée |
2 jours |
Modes |
|
À l’issue de cette formation Fibre Optique FTTH, vous aurez acquis les connaissances et compétences nécessaires pour :
Tarif |
A partir de 1 860,00 € |
Durée |
3j / 21h |
Modes |
|
Tarif |
A partir de 1 585,00 € |
Durée |
2 jours - 14 heures |
Modes |
|
Tarif |
A partir de 2 250,00 € |
Durée |
3 jours |
Modes |
|
Tarif |
A partir de 1 800,00 € |
Durée |
3 jours |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
3j / 21h |
Modes |
|
Tarif |
A partir de 1 618,00 € |
Durée |
2 jours |
Modes |
|
À l'issue de cette formation Développement Sécurisé en C++ vous aurez acquis les connaissances et compétences nécessaires pour :
Tarif |
A partir de 1 580,00 € |
Durée |
2j / 14h |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
4 jours (28 heures) |
Modes |
|