Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
Tarif |
A partir de 2 800,00 € |
Durée | 4 jours |
Modes |
|
Sessions | |
Lieux | Partout en France |
Tarif |
A partir de 2 800,00 € |
Durée | 4 jours |
Modes |
|
Sessions | |
Lieux | Partout en France |
Cette formation vous apportera une grande expertise dans l’utilisation d’outils de traitement de données issues du Big Data. Apprenez à combiner et à mettre en œuvre Pig, Hive et Impala dans votre système Hadoop pour accroître votre potentiel BI. Vous serez en mesure d’exploiter ces outils et adapter leurs utilisations pour un traitement optimal des données : requêtes, transformations, combinaisons, interprétations, stockage, et plus encore !
Les problématiques du Big Data
Retour sur l’architecture MapReduce
Le processus ETL
Hadoop : solutions apportées et manques
Retour sur le système de fichiers distribués Hadoop (HDFS)
L’environnement d’Hadoop
Pig : définition, caractéristiques et rayon d’action
Les cas d’utilisation de Pig
Le langage Pig Latin : caractéristiques et mise en œuvre
Démarrer avec Pig
Connaître les types et les caractéristiques de données simples
Charger les données et définir les champs
Gérer la sortie des données
Techniques de tri et de filtrage des données récoltées
Utiliser les principales fonctions de traitement
Les différents formats de stockage
Connaître les types et les caractéristiques des données complexes et emboîtées
Grouper les données et utiliser la fonction built-in
Programmer des itérations de traitement de données groupées
Effectuer des combinaisons d’ensembles de données
Exécuter des opérations sur des groupes de données
Paramètres avancés
Utiliser des macros et des fonctions utilisateurs (UDF)
Utiliser Pig avec d’autres langages
Méthodes de résolution de problèmes
Utiliser l’UI web d’Hadoop pour le trouble shooting
Méthodes de débogage par échantillonnage de données
Monitoring des performances
Hive : définition, caractéristiques et rayon d’action
Le modèle de stockage de données de Hive
Hive et Pig : concurrence et complémentarités
Le langage de requête HiveQL
Démarrer avec Hive
Les bases et tableaux de données sous Hive
Connaître les types de données et leurs caractéristiques
Les formats de données dans Hive
Méthodes d’assemblage de données et fonctions de built-in
Construire des bases de données et tableaux de gestion Hive
Utiliser des tableaux autogérés
Stocker le résultat des requêtes
Sécuriser l’accès aux données
Les principes du traitement de données textuelles
Utiliser les fonctions String
Principes et applications du « Opinion Mining »
Mettre en œuvre les bonnes pratiques pour la performance des requêtes
Paramétrer les requêtes
Contrôler l’exécution des tâches
Partitionnement des données, bucketing et indexation
Utiliser des scripts pour transformer les données
Mettre en œuvre des fonctions utilisateurs (UDF)
Impala : définition, caractéristiques et rayon d’action
Impala, Pig et Hive : concurrence et complémentarités
Impala dans le monde des bases de données relationnelles
Exemples d’utilisations du Shell Impala
Utiliser la syntaxe Impala
Connaître les types de données et leurs caractéristiques
Techniques de tri et de filtrage des données récoltées
Méthodes d’assemblage de données
Optimiser les performances
Tarif |
Contacter l'organisme |
Durée |
3 jours (21 heures) |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
4 jours (28 heures) |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
2j / 14h |
Modes |
|
Tarif |
A partir de 790,00 € |
Durée |
1j / 7h |
Modes |
|
Tarif |
A partir de 2 250,00 € |
Durée |
3 jours |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
2 jours (14 heures) |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
8 jours (56 heures) |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
12 jours (84 heures) |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
2j / 14h |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
3 jours (21 heures) |
Modes |
|