Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
À l'issue de cette formation Google Cloud Platform : Ingénerie de données vous aurez acquis les connaissances et les compétences nécessaires pour :
Tarif |
A partir de 3 190,00 € |
Durée | 4 jours (28h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
Tarif |
A partir de 3 190,00 € |
Durée | 4 jours (28h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
L'ingénierie de données sur Google Cloud Platform se concentre sur les services Big Data et Machine Learning de la plate-forme cloud de Google.
L'objectif de cette formation Google Cloud Platform : Ingénerie des données est d'apprendre aux participants à concevoir des systèmes de traitement de données, à créer des pipelines de données de bout en bout, à analyser des données et à effectuer un apprentissage automatique. Les démonstrations s'appuient sur les différents services proposés par Google Cloud Platform : BigQuery, Dataflow, Tensorflow, CloudML, Dataproc...
Explorez le rôle d’un data engineer
Analyser les défis d’ingénierie des données
Introduction à BigQuery
Data lakes et data warehouses
Démo : requêtes fédérées avec BigQuery
Bases de données transactionnelles vs data warehouses
Démo : recherche de données personnelles dans votre jeu de données avec l’API DLP
Travailler efficacement avec d’autres équipes de données
Gérer l’accès aux données et gouvernance
Construire des pipelines prêts pour la production
Étude de cas d’un client GCP
Travaux pratiques
Analyse de données avec BigQuery
Introduction aux data lakes
Stockage de données et options ETL sur GCP
Construction d’un data lake à l’aide de Cloud Storage
Démo : optimisation des coûts avec les classes et les fonctions cloud de Google Cloud Storage
Sécurisation de Cloud Storage
Stocker tous les types de données
Démo : exécution de requêtes fédérées sur des fichiers Parquet et ORC dans BigQuery
Cloud SQL en tant que data lake relationnel
Le data warehouse moderne
Introduction à BigQuery
Démo : Requêter des TB + de données en quelques secondes
Commencer à charger des données
Démo : Interroger Cloud SQL à partir de BigQuery
Travaux pratiques
Chargement de données avec la console et la CLI
Explorer les schémas
Exploration des jeux de données publics BigQuery avec SQL à l’aide de INFORMATION_SCHEMA
Conception de schéma
Démo : Exploration des jeux de données publics BigQuery avec SQL à l’aide de INFORMATION_SCHEMA
Champs imbriqués et répétés dans BigQuery
Travaux pratiques
Tableaux et structures
Optimiser avec le partitionnement et le clustering
Démo : Tables partitionnées et groupées dans BigQuery
Aperçu: Transformation de données par lots et en continu
Considérations de qualité
Comment effectuer des opérations dans BigQuery
Démo : ELT pour améliorer la qualité des données dans BigQuery
Des lacunes
ETL pour résoudre les problèmes de qualité des données
L’écosystème Hadoop
Exécution de Hadoop sur Cloud Dataproc GCS au lieu de HDFS
Optimiser Dataproc
Travaux pratiques
Exécution de jobs Apache Spark sur Cloud Dataproc
Cloud Dataflow
Pourquoi les clients apprécient-ils Dataflow ?
Pipelines de flux de données
Travaux pratiques
Pipeline de flux de données simple (Python / Java)
MapReduce dans un flux de données (Python / Java)
Entrées latérales (Python / Java)
Templates Dataflow
Dataflow SQL
Création visuelle de pipelines de données par lots avec Cloud Data Fusion : composants, présentation de l’interface utilisateur, construire un pipeline, exploration de données en utilisant Wrangler
Travaux pratiques
Construction et exécution d’un graphe de pipeline dans Cloud Data Fusion
Orchestrer le travail entre les services GCP avec Cloud Composer - Apache Airflow Environment: DAG et opérateurs, planification du flux de travail
Démo : Chargement de données déclenché par un événement avec Cloud Composer, Cloud Functions, Cloud Storage et BigQuery
Travaux pratiques
Introduction à Cloud Composer
Traitement des données en streaming
Cloud Pub/Sub
Travaux pratiques
Publier des données en continu dans Pub/Sub
Fonctionnalités streaming de Cloud Dataflow
Travaux pratiques
Pipelines de données en continu
Fonctionnalités de streaming BigQuery
Travaux pratiques
Analyse en continu et tableaux de bord
Cloud Bigtable
Travaux pratiques
Pipelines de données en continu vers Bigtable
Analytic Window Functions
Utiliser des clauses With
Fonctions SIG
Démo : Cartographie des codes postaux à la croissance la plus rapide avec BigQuery GeoViz
Considérations de performance
Travaux pratiques
Optimisation de vos requêtes BigQuery pour la performance
Création de tables partitionnées par date dans BigQuery
Qu’est-ce que l’IA ?
De l’analyse de données ad hoc aux décisions basées sur les données
Options pour modèles ML sur GCP
Les données non structurées sont difficiles à utiliser
API ML pour enrichir les données
Travaux pratiques
Utilisation de l’API en langage naturel pour classer le texte non structuré
Qu’est-ce qu’un notebook
BigQuery Magic et liens avec Pandas
Travaux pratiques
BigQuery dans Jupyter Labs sur IA Platform
Façons de faire du ML sur GCP
Kubeflow AI Hub
Travaux pratiques
Utiliser des modèles d’IA sur Kubeflow
BigQuery ML pour la construction de modèles rapides
Démo : Entraîner un modèle avec BigQuery ML pour prédire les tarifs de taxi à New York
Modèles pris en charge
Travaux pratiques
Prédire la durée d’une sortie en vélo avec un modèle de régression dans BigQuery ML
Recommandations de film dans BigQuery ML
Pourquoi Auto ML?
Auto ML Vision
Auto ML NLP
Auto ML Tables
Tarif |
A partir de 2 770,00 € |
Durée |
5j / 35h |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
3j / 21h |
Modes |
|
Concrètement, à l'issue de cette formation Logiciel R vous aurez acquis les connaissances et les compétences nécessairesp pour :
Tarif |
A partir de 2 390,00 € |
Durée |
4j / 28h |
Modes |
|
Tarif |
A partir de 559,00 € |
Durée |
1j / 7h |
Modes |
|
Tarif |
A partir de 1 450,00 € |
Durée |
2j / 14h |
Modes |
|
Tarif |
A partir de 1 560,00 € |
Durée |
2 jours |
Modes |
|
Tarif |
A partir de 3 150,00 € |
Durée |
5j / 35h |
Modes |
|
À l'issue de cette formation AIOps, vous aurez acquis les connaissances nécessaires pour :
Tarif |
A partir de 2 330,00 € |
Durée |
3j / 21h |
Modes |
|
À l'issue de cette formation PostgreSQL, vous aurez acquis les connaissances et compétences nécessaires pour :
Tarif |
A partir de 1 950,00 € |
Durée |
3j / 21h |
Modes |
|
Amazon Web Services fournit des services en ligne à d'autres sites internet ou applications clientes. La plupart d'entre eux ne sont pas directement exposés à l'utilisateur final, mais offrent des fonctionnalités que d'autres développeurs peuvent utiliser.
Concrètement, cette formation vous apportera les connaissances et compétences pour :
Tarif |
A partir de 1 480,00 € |
Durée |
2j / 14h |
Modes |
|