Formation - Big Data - Le SQL distribué
Qualiopi
Objectifs pédagogiques
- Cette formation fait l'objet d'une évaluation formative.
Programme de la formation
1 - Présentation
- Besoin
- Adéquation entre les objectifs et les outils
- Faciliter la manipulation de gros volumes de données en conservant une approche utilisateurs
- Rappels sur le stockage : HDFS, Cassandra, HBase et les formats de données (parquet, orc, raw, clés/valeurs)
- Les outils : Hive, Impala, Tez, Presto, Drill, Pig, Spark/QL
2 - Hive et Pig
- Présentation
- Mode de fonctionnement
- Rappel sur map/reduce
- Hive : le langage HiveQL - Exemples
- Pig : le langage pig/latin - Exemples
3 - Impala
- Présentation
- Cadre d'utilisation
- Contraintes
- Liaison avec le métastore Hive
- Travaux pratiques : mise en évidence des performances
4 - Presto
- Cadre d'utilisation
- Sources de données utilisables
- Travaux pratiques : mise en oeuvre d'une requête s'appuyant sur Cassandra et PostgreSQL
5 - Spark DataFrame
- Les différentes approches
- Syntaxe Spark/SQl
- APIs QL
- Compilation catalyst
- Syntaxe, opérateurs
- Travaux pratiques : mise en oeuvre d'une requête s'appuyant sur HBase et HDFS
6 - Drill
- Utilisation d'APIs JDBC, ODBC
- Indépendance Hadoop
- Contraintes d'utilisation
- Performances
7 - Comparatifs
- Compatibilité ANSI/SQL
- Approches des différents produits
- Critères de choix

Proposé par
IB Cegos
"Formations aux technologies et métiers du Numérique"
Durée
2 jours (14 heures)
Localisation
Partout en France

Proposé par
IB Cegos
