Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Installer et configurer Spark SQL
- Réaliser des analyses de données en utilisant Spark SQL
- Requêter des jeux de données dans différents formats
- Visualiser les données et effectuer des requêtes sur les résultats
Programme de la formation
Introduction à la formation Spark SQL
Présentation générale de la formation, objectifs et approche pédagogiques
Les différentes approches pour l’accès aux données avec Spark : Hive, bases de données…
Les fonctionnalités et l’architecture de Spark
Installer Spark et effectuer les configurations de base
Le module Spark SQL : fonctionnalités, intérêt et avantages par rapport à Hive
Principes de fonctionnement et architecture (Data Source API, DataFrameAPI, SQL Service…)
Requêtes, DataFrames et DataSets
Comprendre les DataFrames dans Spark
Le point de départ : SparkSession
Créer des DataFrames
Requêtes SQL de base
Vues temporaires
Créer des DataSets
Exécuter des agrégations, jointures et requêtes imbriquées
Requêtes sur différents types de données
Accéder aux données
Préparer les données
Schémas RDD
Requêter des fichiers JSON, Parquet, CSV…
Troubleshooting
Mise en cache In-Memory

Proposé par
Sparks
"Tout l'IT, vraiment tout"

Proposé par
Sparks
