Formation Data Warehousing with BigQuery : Storage Design, Query Optimization, and Administration

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

À l'issue de cette formation BigQuery vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Décrire les principes de base de l’architecture BigQuery
  • Implémenter des modèles de conception de stockage et de schéma pour améliorer les performances
  • Utiliser DML et planifier des transferts de données pour ingérer des données
  • Appliquer les meilleures pratiques pour améliorer l’efficacité de la lecture et optimiser les performances des requêtes
  • Gérer la capacité et automatiser les charges de travail
  • Comprendre les modèles par rapport aux anti-modèles pour optimiser les requêtes et améliorer les performances de lecture
  • Utiliser des outils de journalisation et de surveillance pour comprendre et optimiser les modèles d’utilisation
  • Appliquer les meilleures pratiques de sécurité pour gérer les données et les ressources
  • Créer et déployer plusieurs catégories de modèles de machine learning avec BigQuery ML

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 2 100,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 2 100,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Durant cette formation BigQuery vous découvrirez les composants internes de BigQuery et les bonnes pratiques de conception, d’optimisation et d’administration de votre entrepôt de données.

Grâce à une combinaison de passages théoriques, de démonstrations et d’ateliers, vous découvrirez l’architecture BigQuery et découvrirez comment concevoir un stockage et des schémas optimaux pour l’ingestion et les modifications de données. Ensuite, vous apprendrez des techniques pour améliorer les performances de lecture, optimiser les requêtes, gérer les charges de travail et utiliser les outils de journalisation et de surveillance.

Vous découvrirez également les différents modèles de tarification. Enfin, vous apprendrez différentes méthodes pour sécuriser les données, automatiser les charges de travail et créer des modèles de machine learning avec BigQuery ML.

Programme

Principes de base de l’architecture BigQuery

Introduction
Infrastructure centrale BigQuery
Stockage BigQuery
Traitement des requêtes BigQuery
Shuffling des données BigQuery

Optimisations de stockage et de schéma

Stockage BigQuery
Partitionnement et clustering
Champs imbriqués et répétés
Syntaxe ARRAY et STRUCT
Les meilleures pratiques

Ingestion de données

Options d’intégration de données
Ingestion par lots
Ingestion de diffusion en continu
Legacy Streaming API
BigQuery Storage Write API
Matérialisation des requêtes
Interroger des sources de données externes
Service de transfert de données

Modification des données

Gestion du changement dans les entrepôts de données
Gestion des Slowly Changing Dimensions (SCD)
Déclarations DML
Bonnes pratiques DML et problèmes courants

Améliorer les performances de lecture

Cache de BigQuery
Vues matérialisées
BI Engine
Lectures à haut débit
API de lecture de stockage BigQuery

Optimisation et dépannage des requêtes

Exécution simple des requêtes
SELECT et Agrégation
JOIN et JOIN biaisés
Filtrage et classement
Meilleures pratiques pour les fonctions

Gestion de la charge de travail et tarification

Emplacements BigQuery
Modèles de tarification et estimations
Réservations de créneaux
Contrôle des coûts

Journalisation et surveillance

Cloud Monitoring
BigQuery Admin Panel
Cloud Audit Logs
INFORMATION_SCHEMA
Chemin de requête et erreurs courantes

Security in BigQuery

Ressources sécurisées avec IAM
Vues autorisées
Données sécurisées avec classification
Chiffrement
Découverte et gouvernance des données

Automatisation des charges de travail

Planifier des requêtes
Script
Procédures stockées
Intégration avec les produits Big Data

Apprentissage automatique dans BigQuery

Présentation de BigQuery ML
Comment faire des prédictions avec BigQuery ML
Comment créer et déployer un système de recommandation avec BigQuery ML
Comment créer et déployer une solution de prévision de la demande avec BigQuery ML
Modèles de séries temporelles avec BigQuery ML
BigQuery ML Explainability

Prérequis

Pour suivre cette formation BigQuery il est recommandé d'avoir des connaissances préalables en Big Data et en machine learning. Vous pouvez les acquérir en suivant par exemple la formation Machine Learning : État de l'art et bonnes pratiques (OMLE).

Public

Ce cours BigQuery s'adresse aux analystes de données, data scientists, ingénieurs de données et développeurs qui effectuent des travaux à grande échelle nécessitant des connaissances internes avancées de BigQuery pour optimiser les performances.

Ces formations pourraient vous intéresser

Objectifs de la formation

The Implementing Cisco Catalyst 9000 Switches course (ENC9K) introduces you to the architecture, capabilities, and implementation of the Cisco Catalyst 9000 switching platform. This hands-on course covers many features of this Cisco IOS XE platform and describes how to manage devices from a single dashboard called Cisco DNA Center. You will learn how to use the Cisco Catalyst 9000 family of switches to enable Software Defined Access (SD-Access) and provide end-to-end security and automation with centralized management using DNA Center.

Course benefits :

  • Get to know the next generation in the Cisco Catalyst family of enterprise LAN access, aggregation, and core switches
  • Prepare for successful deployment of the Cisco Catalyst 9000 switching family
  • Understand the role of Cisco Catalyst 9000 switches in the SD-Access fabric
  • Learn to provision Cisco Catalyst 9000 switches using Cisco DNA center as the orchestration platform
  • Gain hands-on practice through in-depth lab exercises
Tarif

A partir de 2 890,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Il est enfin accepté dans les appréciations des décideurs que les développeurs ne sont pas tous égaux ! La réussite d'un projet de x jours/homme dépend principalement des hommes qui réaliseront ce projet. Cette formation « Design Principles » a pour objectif de transformer des développeurs ayant des premières expériences en des développeurs « full-stack », capables d'appréhender tous les composants nécessaires à l'élaboration des applications modernes afin de participer aux choix techniques de conception et d'architecture.

Cette formation au contenu technique dense et de haut niveau propose de nombreux ateliers participatifs. A l'instar des développements agiles, prônant la communication inter-équipes, les stagiaires collaborent pendant les ateliers et donnent un avis critique et constructif sur les différentes implémentations proposées par leurs pairs ou par le formateur.

Tarif

A partir de 1 890,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation MySQL, vous aurez acquis les connaissances et compétences pour : 

  • Connaître le fonctionnement et l’architecture d’une base de données MySQL
  • Savoir installer une base de données MySQL
  • Être capable de gérer une base de données MySQL au quotidien
  • Savoir configurer les permissions et les accès selon les profils utilisateur
  • Savoir sauvegarder et restaurer des données au sein de MySQL
  • Mettre en œuvre la sécurité dans votre base de données MySQL
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Découvrir et utiliser la puissance prédictive des modèles ensemblistes
  • Savoir effectuer un "feature engineering" performant
  • Appréhender les techniques de text-mining et de deep-learning à travers d'exemples concrets
  • Enrichir ses outils de data scientist
Tarif

A partir de 2 500,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Découvrir l’UX Design et l’importance de l’expérience utilisateur
  • Connaître les exigences ergonomiques particulières d'une application mobile
  • S'approprier les bonnes pratiques pour concevoir une app mobile en co-conception avec les utilisateurs réels
  • Utiliser Figma pour réaliser des prototypes interactifs d'applications pur smartphone et tablette
Tarif

A partir de 2 100,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise

Objectifs de la formation

  • Maîtriser le logiciel Catia pour la conception surfacique
  • Comprendre le Generative shape Design ou wireframe surf design
  • Savoir modéliser des surfaces simples, de raccords, complexes
  • Gérer les surfaces multi-sections, le remplissage, l'assemblage, la couture
  • Savoir analyser et optimiser les surfaces
Tarif

A partir de 1 500,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Strengthen the knowledge on regulation changes following European directives on AML
  • Describe the type of customers base involved
  • Keep up to date knowledge on AML vigilance
  • Control procedures on suspicion report
  • Respect the evolution of the sanctions imposed by the authorities
  • Ascertain the designated persons' list regarding embargos and international sanctions
Tarif

A partir de 175,00 €

Durée

90 days

Modes
  • Entreprise

Objectifs de la formation

  • Identifier les fonctionnalités clés de SharePoint 2013 et savoir les mettre en oeuvre
  • Configurer et administrer la solution Microsoft SharePoint 2013
  • Sécuriser les contenus dans les sites SharePoint
  • Assurer la surveillance et optimiser la performance SharePoint
Tarif

A partir de 1 390,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Designing Cisco Data Center Infrastructure vous aurez acquis les connaissances et les compétences nécessaires pour : 

  • Faire des choix de conception pour optimiser les performances de l'infrastructure du centre de données, la virtualisation, la sécurité et l'automatisation
  • Maîtriser les connaissances pratiques et théoriques nécessaires pour concevoir un centre de données évolutif, fiable et intelligent basé sur les technologies Cisco
  • Se qualifier pour des postes de niveau professionnel dans le domaine très demandé des environnements de centres de données d'entreprise
  • Décrire les options et les protocoles de transfert de la couche 2 et de la couche 3 utilisés dans un centre de données
  • Décrire les options de conception des racks, les modèles de trafic et l'accès, l'agrégation et le noyau de la couche de commutation du centre de données
  • Décrire la technologie Cisco Overlay Transport Virtualization (OTV) qui est utilisée pour interconnecter les centres de données
  • Décrire le protocole de séparation Locator/ID
  • Concevoir une solution qui utilise le réseau local extensible virtuel (VXLAN) pour le transfert du trafic
  • Décrire les options de redondance matérielle ; comment virtualiser le réseau, les fonctions de calcul et de stockage ; et la mise en réseau virtuelle dans le centre de données
  • Décrire les solutions qui utilisent des extensions de fabric et comparer Cisco Adapter Fabric Extender (FEX) avec la virtualisation entrée/sortie à racine unique (SR-IOV : single root input/output virtualization)
  • Décrire les menaces et les solutions de sécurité dans le centre de données
  • Décrire les technologies avancées de sécurité des centres de données et les best practices
  • Décrire la gestion et l'orchestration des appareils dans le centre de données
  • Décrire les options de stockage pour la fonction de calcul et les différents niveaux de RAID (Redundant Array of Independent Disks) du point de vue de la haute disponibilité et des performances
  • Décrire les concepts, les topologies, l'architecture et les termes de l'industrie Fibre Channel
  • Décrire Fibre Channel over Ethernet (FCoE)
  • Décrire les options de sécurité dans le réseau de stockage
  • Décrire les options de gestion et d'automatisation de l'infrastructure de réseau de stockage
  • Décrire les serveurs UCS Cisco et les cas d'utilisation pour diverses plateformes UCS Cisco
  • Expliquer les options de connectivité pour les interconnexions en tissu pour les connexions vers le sud et vers le nord
  • Décrire la solution hyperconvergente et les systèmes intégrés
  • Décrire les paramètres de l'ensemble du système pour la mise en place d'un domaine UCS Cisco
  • Décrire le contrôle d'accès basé sur les rôles (RBAC : role-based access control) et l'intégration avec les serveurs d'annuaire pour contrôler les droits d'accès sur Cisco UCS Manager
  • Décrire les pools qui peuvent être utilisés dans les profils de service ou les modèles de profils de service sur Cisco UCS Manager
  • Décrire les différentes politiques dans le profil de service
  • Décrire les politiques d'interface Ethernet et Fibre Channel et les technologies réseau supplémentaires
  • Décrire les avantages des modèles et la différence entre les modèles initiaux et les modèles mis à jour
  • Décrire les outils d'automatisation des centres de données
Tarif

A partir de 4 140,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Big Data Python, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Utiliser le langage Python dans la modélisation statistique
  • Utiliser les outils d’analyse des données en Python
  • Préparer différents types de données à l’analyse (nettoyage)
  • Extraire les données de différentes sources (fichier, base de données, etc.)
  • Déterminer les fonctions à utiliser selon le type de données
  • Évaluer les performances prédictives d’un algorithme
  • Utiliser Python dans un environnement Big Data
  • Apprendre à mettre en place un modèle d'apprentissage simple Choisir entre la régression et la classification en fonction du type de données
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
  • Connaître les possibilités de représentations graphiques en Python
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...