Formation - Big Data - Le SQL distribué

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

1 - Présentation

  • Besoin
  • Adéquation entre les objectifs et les outils
  • Faciliter la manipulation de gros volumes de données en conservant une approche utilisateurs
  • Rappels sur le stockage : HDFS, Cassandra, HBase et les formats de données (parquet, orc, raw, clés/valeurs)
  • Les outils : Hive, Impala, Tez, Presto, Drill, Pig, Spark/QL

2 - Hive et Pig

  • Présentation
  • Mode de fonctionnement
  • Rappel sur map/reduce
  • Hive : le langage HiveQL - Exemples
  • Pig : le langage pig/latin - Exemples

3 - Impala

  • Présentation
  • Cadre d'utilisation
  • Contraintes
  • Liaison avec le métastore Hive
  • Travaux pratiques : mise en évidence des performances

4 - Presto

  • Cadre d'utilisation
  • Sources de données utilisables
  • Travaux pratiques : mise en oeuvre d'une requête s'appuyant sur Cassandra et PostgreSQL

5 - Spark DataFrame

  • Les différentes approches
  • Syntaxe Spark/SQl
  • APIs QL
  • Compilation catalyst
  • Syntaxe, opérateurs
  • Travaux pratiques : mise en oeuvre d'une requête s'appuyant sur HBase et HDFS

6 - Drill

  • Utilisation d'APIs JDBC, ODBC
  • Indépendance Hadoop
  • Contraintes d'utilisation
  • Performances

7 - Comparatifs

  • Compatibilité ANSI/SQL
  • Approches des différents produits
  • Critères de choix

Prérequis

  • Connaissance générale des systèmes d'informations et des bases de données

Public

  • Experts en bases de données relationnelles, chefs de projet

Ces formations pourraient vous intéresser

SQL – Les fondamentaux

Proposé par ENI Service

Objectifs de la formation

  • Appréhender les principaux concepts des SGDBR (Système de Gestion des Bases de Données Relationnelles) et d'algèbre relationnelle utilisés dans le langage SQL
  • Prendre en main un environnement SQL
  • Appréhender l'écriture des requêtes SQL pour extraire des données et mettre à jour la base
  • Manipuler les données dans une base avec SQL
  • Extraire les informations de plusieurs tables
  • Assimiler les fonctions standards du langage SQL
Tarif

A partir de 1 790,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Répondre à l'ensemble des problématiques générées par la complexité apparente des infrastructures des bâtiments et de Data Centers
  • Vous préparer à toute nouvelle réalisation, rénovation ou exploitation, avec pour principaux objectifs, la pérennité, la disponibilité et la garantie de bande passante élevée et de support des applications à haut débit jusqu'à 400 Gbps.
Tarif

A partir de 2 290,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Concevoir des communications visuelles « à voir » avant d’être lues
  • Concevoir des représentations graphiques
  • Optimiser les processus de compréhension face à des constructions graphiques complexes
  • Acquérir les outils méthodologiques pour concevoir des représentations graphiques efficaces
Tarif

A partir de 1 690,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

Concrètement, à l'issue de cette formation Data Warehousing sur AWS vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Présenter les concepts principaux du Data Warehousing
  • Évaluer les relations entre Amazon Redshift et les autres systèmes Big Data
  • Savoir présenter les différentes charges de travail exploitables dans une solution de Data warehouse à base de AWS dans analytics, grâce à l'observation d’études de cas
  • Choisir un type de nœud Amazon Redshift et le dimensionner en fonction des besoins en données
  • Présenter les fonctionnalités de sécurité qui appartiennent à Amazon Redshift, telles que le cryptage, les permissions IAM et les permissions de bases de données
  • Lancer un cluster Amazon Redshift et utiliser les composants et les fonctionnalités pour mettre en œuvre un datawarehouse dans le cloud
  • Utiliser les données AWS et les services analytiques tels que Amazon DynmaoDB, Amzon EMR, Amazon Kinesis Firehose et Amazon E3 pour constituer la solution de data warehouse
  • Évaluer les approches et les méthodologies pour concevoir des data warehouse
  • Identifier les sources de données et les besoins en accès qui affectent la conception du data warehouse
  • Concevoir le data warehouse pour une utilisation efficace de la compression des données, la distribution des données et les méthodes de tri
  • Charger et décharger les données et améliorer les tâches de maintenance des données
  • Écrire les requêtes et évaluer les plans d’exécution pour en optimiser la performance
  • Configurer la base de données pour allouer des ressources, telles que la mémoire des files d’attente de requêtes, et définir les critères pour router certains types de requêtes
  • Utiliser les fonctionnalités et les services, tels que l’audit des base de données Amazon Redshift, Amazon CloudTrail, Amazon CloudWatch et Amazon SNS (Simple Notification Service), pour auditer, surveiller et recevoir les notifications d’évènements concernant les activités dans le data warehouse
  • Préparer les tâches opérationnelles, tels que le redimensionnement des clusters Amazon Redshift et utiliser les snapshots pour sauvegarder et restaurer les clusters
  • Utiliser l’application de Business Intelligence pour améliorer l’analyse des données et les tâches de création de rapports.
Tarif

A partir de 2 510,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les concepts de base pour la conception de Data Centers
  • Présenter la terminologie et les concepts en rapport avec la plateforme Amazon Web Services (AWS)
  • Tester la navigation dans AWS Management Console
  • Lister les services d'infrastructure fondamentaux, notamment Amazon Virtual Private Cloud (VPC), Amazon Elastic Compute Cloud (EC2), Amazon Elastic Block Store (EBS), Amazon Simple Storage Service (S3), Auto Scaling et Elastic Load Balancing (ELB)
  • Appliquer les mesures de sécurité proposées par AWS et les concepts clés d'AWS Identity and Access Management (IAM)
  • Enumérer les services de bases de données AWS, notamment Amazon DynamoDB et Amazon Relational Database Service (RDS)
  • Utiliser les outils de gestion AWS, notamment Amazon CloudWatch et AWS Trusted Advisor.
Tarif

A partir de 810,00 €

Durée

1j / 7h

Modes
  • Centre
  • Distance

Objectifs de la formation

À l'issue de cette formation Big Data Python, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Utiliser le langage Python dans la modélisation statistique
  • Utiliser les outils d’analyse des données en Python
  • Préparer différents types de données à l’analyse (nettoyage)
  • Extraire les données de différentes sources (fichier, base de données, etc.)
  • Déterminer les fonctions à utiliser selon le type de données
  • Évaluer les performances prédictives d’un algorithme
  • Utiliser Python dans un environnement Big Data
  • Apprendre à mettre en place un modèle d'apprentissage simple Choisir entre la régression et la classification en fonction du type de données
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
  • Connaître les possibilités de représentations graphiques en Python
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre ce qu’est l’IA, la data, et être en mesure d’interagir avec confiance avec les équipes data d’une organisation
  • Connaître les différentes technologies de l'IA et leurs applications potentielles dans l'analyse métier
  • Maîtriser les techniques de prompt engineering pour une communication efficace avec les systèmes d'IA
  • Mettre en œuvre des outils d'IA dans des scénarios pratiques de Business Analyse pour améliorer la prise de décision, les prévisions et l'optimisation des processus
  • Comprendre la gestion du changement organisationnel et les considérations éthiques liées à l'intégration de l'IA dans les process de l'analyse métier
Tarif

A partir de 1 800,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les responsabilités et compétences clés d'un Data Analyst
  • Comprendre les méthodes de collecte, de traitement et d'analyse des données
  • Connaître les outils et technologies couramment utilisés par les Data Analysts
Tarif

A partir de 700,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Déployer vSphere avec Tanzu
  • Mettre en œuvre VMware Tanzu Mission Control
  • Appliquer les exigences de mise en réseau VMware NSX pour vSphere avec Tanzu
  • Utiliser vSphere avec Tanzu sur NSX-T Data Center
  • Créer et gérer vSphere avec les espaces de noms Tanzu.
  • Déployer et exécuter des applications pour conteneurs sur vSphere avec Tanzu
  • Décrire le service VMware Tanzu Kubernetes Grid
  • Déployer un cluster Tanzu Kubernetes Grid
  • Exécuter et diriger des applications de conteneurs sur un cluster Tanzu Kubernetes Grid
  • Décrire le cycle de vie de vSphere avec Tanzu
  • Utiliser les logs et les commandes CLI pour surveiller et dépanner vSphere avec Tanzu
Tarif

A partir de 2 450,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Ceph est une plateforme de stockage distribué open source. Elle permet de gérer le stockage des données indépendamment du support physique, multipliant ainsi la capacité de stockage. Ceph s'ouvre aussi au Cloud grâce à son intégration avec Amazon et OpenStack.

C'est l'une des solutions leaders de stockage distribué open source.

Cette formation Ceph permettra aux participants de :

  • Comprendre le fonctionnement des systèmes de stockages distribués et donc de Ceph
  • Appendre à le mettre en oeuvre et savoir le configurer
  • Gérer les clients Ceph
  • Prendre en compte la haute disponibilité et savoir valider la fiabilité
Tarif

A partir de 1 610,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...