Formation - Google Cloud Platform - Analyse et visualisation de données
Qualiopi
Objectifs pédagogiques
- Cette formation fait l'objet d'une évaluation formative.
Programme de la formation
1 - Présentation des données dans Google Cloud Platform
- Mettre en avant les difficultés auxquelles font face les analystes de données
- Comparer le Big Data sur site et dans le Cloud
- Étudier des cas d'utilisation concrets d'entreprises qui se sont transformées grâce à l'analyse dans le Cloud
- Découvrir les principes de base du projet Google Cloud Platform
- Atelier : Premiers pas avec Google Cloud Platform
2 - Présentation des outils de Big Data
- Présentation des tâches, des défis et des outils de données de Google Cloud Platform
- Démonstration : Analyser 10 milliards d'enregistrements avec Google BigQuery
- Découvrir 9 fonctionnalités essentielles de Google BigQuery
- Comparer les outils GCP pour les analystes, les data scientists et les ingénieurs de données
- Atelier : Explorer des ensembles de données avec Google BigQuery
3 - Exploration de vos données avec SQL
- Comparer les techniques courantes d'exploration des données
- Apprendre à coder le langage SQL standard de haute qualité
- Explorer les ensembles de données publics Google BigQuery
- Aperçu de visualisation : Google Data Studio
- Atelier : Résoudre les erreurs SQL courantes
4 - Tarifs de Google BigQuery
- Présentation complète d'une tâche BigQuery
- Calculer les tarifs de BigQuery : coûts du stockage, des requêtes et de streaming
- Optimiser les coûts des requêtes
- Atelier : Calculer les tarifs de Google BigQuery
5 - Nettoyage et transformation de vos données
- Étudier les 5 principes de l'intégrité d'un ensemble de données
- Caractériser la forme et l'inclinaison des ensembles de données
- Nettoyer et transformer les données à l'aide de SQL
- Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : présentation de Cloud Dataprep
- Atelier : Explorer et mettre en forme les données avec Cloud Dataprep
6 - Stockage et exportation des données
- Comparer les tables permanentes aux tables temporaires
- Enregistrer et exporter les résultats de requêtes
- Aperçu des performances : cache des requêtes
- Atelier : Créer des tables permanentes
7 - Ingestion de nouveaux ensembles de données dans Google BigQuery
- Requêter à partir de sources de données externes
- Éviter les pièges liés à l'ingestion de données
- Ingérer de nouvelles données dans des tables permanentes
- Discuter des insertions en streaming
- Atelier : Ingérer et interroger de nouveaux ensembles de données
8 - Visualisation des données
- Présentation des principes de visualisation des données
- Comparer l'analyse exploratoire à l'analyse explicative
- Démonstration : Interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Atelier : Explorer un ensemble de données dans Google Data Studio
9 - Regroupement et fusion des ensembles de données
- Fusionner les tables de données historiques avec UNION
- Intégrer des caractères génériques de table pour faciliter la fusion
- Étudier les schémas de données : associer les données entre plusieurs tables
- Présentation complète d'exemples JOIN et des pièges associés
- Atelier : Associer et regrouper des données provenant de plusieurs tables
10 - Fonctions avancées et clauses
- Passer en revue les instructions de cas SQL
- Présentation des fonctions de fenêtre d'analyse
- Sauvegarder les données avec le cryptage de champ unidirectionnel
- Discuter de la conception efficace des sous-requête et des CTE
- Comparer les fonctions définies par l'utilisateur dans SQL et JavaScript
- Atelier : Obtenir des informations grâce aux fonctions SQL avancées
11 - Conception de schémas et structures de données imbriquées
- Comparer Google BigQuery à l'architecture de données SGBDR traditionnelle
- Normalisation et dénormalisation : compromis de performance
- Étude du schéma : Le Bon, la Brute et le Truand
- Tableaux et données imbriquées dans Google BigQuery
- Atelier : Interroger des données imbriquées et répétées
12 - Visualisation améliorée avec Google Data Studio
- Créer des instructions de cas et des champs calculés
- Éviter les problèmes de performance grâce au cache
- Partager les tableaux de bord et discuter de l'accès aux données
13 - Optimisation des performances
- Éviter les problèmes de performance de Google BigQuery
- Empêcher les points d'accès dans vos données
- Diagnostiquer les problèmes de performances grâce au mappage Query Explanation
- Atelier : Optimisation et dépannage des performances de requête
14 - Accès aux données
- Comparer les rôles des ensembles de données IAM et BigQuery
- Éviter les pièges liés à l'accès
- Passer en revue les membres, les rôles, les organisations, l'administration des comptes et les comptes de service
15 - Notebooks dans le Cloud
- Cloud Datalab
- Compute Engine et Cloud Storage
- Atelier : Louer une VM pour traiter des données sur des séismes
- Analyse de données avec BigQuery
16 - Google et le Machine Learning
- Introduction au Machine Learning pour les analystes
- S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
- Atelier : API de ML pré-entraînées
17 - Application du Machine Learning à vos ensembles de données (BQML)
- Créer des ensembles de données de Machine Learning et analyser les fonctionnalités
- Créer des modèles de classification et de prévision à l'aide de BQML
- Atelier : Prédire les achats des visiteurs avec un modèle de classification dans BQML
- Atelier : Prédire le prix d'une course en taxi à l'aide d'un modèle de prévision BigQuery ML

Proposé par
IB Cegos
"Formations aux technologies et métiers du Numérique"
Durée
3 jours (21 heures)
Localisation
Partout en France

Proposé par
IB Cegos
