Formation Hadoop - HBase, mise en œuvre et administration

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

À l'issue de cette formation Hadoop HBase, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Positionner Hbase dans l’écosystème Hadoop
  • Comprendre l’architecture et le fonctionnement de HBase
  • Identifier les avantages de HBase pour le stockage distribué des données
  • Savoir dialoguer avec un système Hbase (shell)
  • Mettre en place un cluster Hbase en mode distribué
  • Comprendre comment Hbase est utilisé en production par les applications

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 1 410,00 €

Durée 2 jours (14h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 1 410,00 €

Durée 2 jours (14h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

HBase est un SGBD non relationnel capable de gérer de très gros volumes de données grâce au système de fichiers distribués HDFS (Hadoop Distributed Filesystem) sur lequel il repose. La formation démarre par une présentation de Hadoop et de la place de Hbase dans cet éco-système. Puis nous présentons l’architecture générale de Hbase et son mécanisme de cluster pour permettre le stockage distribué et performant des données. Ensuite vous installez Hbase dans une démarche pédagogique pour prendre en main votre environnement.

La présentation du shell de Hbase permet d’être plus autonome et efficace dans le dépannage de Hbase au quotidien. En effet, le rôle de création des bases et de leur remplissage est plus souvent effectué par programmation que par script et jamais en interactif. Mais cependant, l’interactivité du shell est un grand allié pédagogique car on obtient « tout de suite » la réponse à sa question et on peut avancer pas à pas. Nous lui consacrons donc une part importante dans la formation. Dans le chapitre dédié à la programmation autour de HBase nous vous guidons afin que tous les participants, développeurs ou non, comprennent comment HBase est exploité réellement en production.

Programme

Jour 1

Introduction à Hadoop et à Hbase

Les fonctionnalités du Framework Hadoop
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Fonctionnalités : failover automatique, sharding
Hbase dans l’écosystème Hadoop
Différences logiques entre Hbase et un SGBDR 
Différences physiques avec un SGBDR (rôle de HDFS)
Précisions sur le vocabulaire et les concepts HBase (table, région, ligne, famille de colonnes, cellules…)
Travaux pratiquesCréation d’un modèle de données Hbase pour comprendre la vision de l’utilisateur sous forme de lignes et de colonnes dans un univers « sans schéma ».

Architecture Hbase et clusters

Vue générale des différents types de serveurs
Fournir des données pour les lectures/écritures aux clients (Region Servers)
Gérer l’affectation des régions et les opérations de création et suppression de tables (HBase Hmaster)
Maintenir le cluster en l’état (Zookeeper)
Fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
Fonctionnement du stockage basé sur HDFS
Passage au mode distribué : mise en œuvre avec HDFS dans un environnement distribué
Rôles et structure des fichiers HFiles (table, famille de colonne, colonne, row key)
Rôles des DataNode et NameNode
Travaux pratiquesQuiz sur le rôle des différents composants d’une architecture Hbase en cluster
Création de plusieurs environnements différents en cluster 
Mise en œuvre des splits sur un exemple de tables réparties.

Installation

Choix des packages.
Installation et configuration dans le fichier conf/hbase-site.xml
Démarrage en mode standalone start-hbase.
Test de connexion avec hbase shell.
Installation en mode distribué.
Les configurations pré-installées sur Hadoop
Les distributions Hbase dans le Cloud
Travaux pratiquesCe TP a un intérêt pédagogique pour bien comprendre le contenu et le fonctionnement de Hbase car au quotidien on utilise souvent des distributions qui proposent un environnement pré-installé (comme Hadoop) ou encore une version Cloud de Hbase proposée par les principaux acteurs (Azure, AWS, GCP). 
Installation et test de connexion. Observations des différents fichiers générés. Visualisation des démons Hadoop et Hbase démarrés pour comprendre leur complémentarité. Visite de Hbase dans Azure (HDInsight Hbase) pour comprendre les points communs entre les différents packagings de Hbase sur le marché (et les différences ou non au niveau utilisateur).
Jour 2

HBase utilisation : shell

Présentation des différentes interfaces disponibles.
Commandes de base, syntaxe, variables
Prendre en main l’aide
Gestion des autorisations (grant,list_security_capabilities,revoke,user_permission)
Manipulation des données : create, list, put, scan, get
Commandes sur les tables (disponibilité, existence, liste, suppression, etc.)
Principe des filtres
Mise en œuvre de filtres de recherche, paramètres des tables.
Présentation des espaces de nommage.
Synthèse sur les commandes générales (voir les bases, informations sur les grappes)
Synthèse sur les commandes d’espaces de nom
Programmation par scripts.
Travaux pratiquesManipulation des données par shellscript (création automatique de tables dans un espace de noms, familles de colonnes associées, insertion d’un gros volume de données, vérification de nos actions via des requêtes d’informations)
Recherche de données dans notre base 
Surveillance de Hbase en production : les commandes pour constituer un tableau de bord d’exploitation

Programmation autour de Hbase

Concepts d’API
Utilisation de Hbase par un langage tiers (Java, C#, Python, etc.)
Chargement de fichiers pour remplir une base Hbase
Lien avec MapReduce.
Présentation rapide de Spark
Traitements avec Spark sur des données Hbase
Travaux pratiquesIl n’est pas nécessaire de connaître Java pour ce TP c’est surtout le concept d’ouverture de Hbase vers les applications que nous souhaitons montrer ici. Les programmes sont fournis aux participants.
Chargement d’un fichier au format tsv dans notre base Hbase puis déclenchement d’un traitement MapReduce.
TP guidé pour utiliser Spark afin de compter le nombre d’élément présent en base et de calculer des sommes de ventes de produits. L’objectif est de montrer que Spark peut être utilisé pour réaliser des traitements complexes sur les données de HBase (traitements parallèles directement là où les données sont stockées dans notre exemple).

Prérequis

Pour suivre cette formation Hadoop HBase il est recommandé de connaitre les bases de Hadoop et des bases de données (requête SQL basique par exemple). Il n’est pas nécessaire de connaître la programmation pour le dernier chapitre car les exemples de code applicatif sont mis à disposition par le formateur.

Public

Ce cours Hadoop HBase s'adresse en priorité aux chefs de projets, administrateurs ou développeurs.
Elle convient également à toute personne participant à un projet technique autour de Hbase.

Ces formations pourraient vous intéresser

Objectifs de la formation

Savoir mettre en place une infrastructure avec Ubuntu. 

A l'issue de cette formation Ubuntu Mise en place d'une infrastructure vous aurez acquis les connaissances et compétences nécessaires pour :

  • Etre en mesure de déployer avec confiance Ubuntu Server Edition dans son entreprise
  • Apprendre les derniers trucs et astuces des experts Ubuntu
  • Savoir aider son entreprise à réduire les coûts et améliorer l'efficacité avec une infrastructure IT stable et facile à gérer
  • Déployer de nouveaux services plus rapidement et introduire des innovations plus vite
  • Eviter des contrats de licences coûteux
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Connaître les concepts de base et l'architecture de Snowflake
  • Établir une connexion à Snowflake, charger et décharger des données
  • Exploiter et traiter les données de manière optimisée
  • Comprendre les structures de stockage de données
  • Optimiser les performances des requêtes
  • Travailler avec des données semi-structurées
  • Mettre en œuvre les meilleures pratiques de collaboration et d’automatisation
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l’issue de cette formation Achats Responsables, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre le lien entre RSE et achats responsables
  • Identifier les enjeux et impacts des achats matériels et immatériels liés au numérique
  • Analyser vos pratiques vers des pratiques plus responsables
  • Définir un plan d’action de mise en place des outils pour appuyer cette démarche
Tarif

A partir de 1 480,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation Hacking outils offensifs, vous aurez acquis les connaissances et les compétences nécessaires pour : 

  • Comprendre les concepts de la Red Team et les techniques d'attaque les plus courantes
  • Savoir énumérer les systèmes Windows et les services pour trouver des points d'entrée potentiels
  • Comprendre comment effectuer une reconnaissance avancée sur un environnement cible, en utilisant des outils tels que BloodHound pour cartographier les relations entre les utilisateurs et les ordinateurs
  • Maîtriser les techniques de persistance et comment les mettre en œuvre pour maintenir l'accès à un système après une intrusion
  • Apprendre les techniques d'escalade de privilèges pour obtenir des droits d'administrateur et étendre l'accès à l'environnement cible
  • Savoir comment développer des outils populaires tels que Mimikatz et Meterpreter pour extraire des informations sensibles et prendre le contrôle des systèmes cibles
  • Apprendre comment établir des tunnels de commande et contrôle pour contrôler les systèmes à distance
Tarif

A partir de 2 590,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Formation CX Design

Proposé par Sparks

Objectifs de la formation

  • Analyser les besoins et les attentes des clients afin de définir des stratégies de Customer eXperience (CX)
  • Comprendre les principes de l'expérience utilisateur (UX) et leur application dans la conception CX
  • Concevoir et mettre en œuvre des Service Blueprints efficaces qui améliorent les interactions avec les clients à chaque point de contact
  • Sélectionner les outils et technologies adéquats pour créer des expériences client personnalisées et attrayantes
  • Évaluer et mesurer l'impact des stratégies CX sur la satisfaction des clients et les résultats de l'entreprise
Tarif

A partir de 1 400,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Formation Prototype et Scriptaculous

Proposé par PLB CONSULTANT

Objectifs de la formation

A l'issue de la formation Prototype et Scriptaculous vous aurez acquis les connaissances et compétences nécessaires pour :

  • Développer plus rapidement la mise à jour partielle ou périodique d'une page (Ajax, XMLHttpRequest)
  • Manipuler le DOM afin de récupérer, insérer, ou masquer les éléments HTML des pages de façon plus efficace et avec de nouvelles fonctionnalités
  • Utiliser les solutions offertes par Prototype aux incompatibilités entre les navigateurs (COMPAT),
  • Manipuler plus facilement les structures de données JavaScript avec de nouveaux composants comme String, Enumerable, Array
  • Gérer les événements HTML à l'aide de la classe Event
  • Proposer des effets visuels riches
  • Rendre des éléments HTML déplaçables en Drag & Drop
  • Utiliser des sliders dans la page HTML
  • Proposer l'autocomplétion dans vos pages
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Architecture Google Cloud Engine vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Configurer les réseaux VPC et les machines virtuelles
  • Administrer la gestion des identités et des accès pour les ressources
  • Mettre en œuvre des services de stockage de données dans Google Cloud
  • Gérer et examiner la facturation des ressources Google Cloud
  • Surveiller les ressources à l’aide des services Google Cloud
  • Connecter votre infrastructure à Google Cloud
  • Configurer les équilibreurs de charge et l’autoscaling pour les instances de VM
  • Automatiser le déploiement des services d’infrastructure Google Cloud
  • Tirer parti des services gérés dans Google Cloud
Tarif

A partir de 2 380,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

 

Ainsi, elles ont recours au Test Maturity Model Integrated (TMMI) pour :

- Des systèmes informatiques de plus en plus complexes
- Des solutions technologiques évolutives
- Des demandes en Time To Market Le TMMI est un modèle de maturité qualité très intéressant pour toute structure qui veut améliorer son activité de test et la qualité de ses produits. Concrètement les stagiaires repartiront de cette formation en sachant notamment :
- Comprendre les enjeux de la mise en place d’une démarche TMMI
- Connaître la structure du modèle TMMI
- Comprendre les niveaux de base du TMMI

Tarif

A partir de 2 290,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation DevOps certifiante vous aurez acquis les compétences et connaissances nécessaires pour :

  • Comprendre les objectifs et le vocabulaire DevOps
  • Connaître les avantages de DevOps pour l’entreprise
  • Connaître les concepts et pratiques DevOps (y compris sa relation avec Agile, Lean et IT Service Management - ITSM)
  • Appréhender la communication et les boucles de rétroaction améliorées
  • Mettre en œuvre l’automatisation et ses dépendances
  • Appliquer DevOps dans un environnement d'entreprise
  • Comprendre les facteurs de succès et les indicateurs clés de performance
  • Se préparer au passage de la certification « DevOps Foundation »

Pour les personnes intéressées par la pratique et les outils, plus que par le passage de l'examen, nous proposons de suivre plutôt la formation Infrastructure DevOps : Les outils (Réf. OODO).

Tarif

A partir de 1 480,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Cette formation Hadoop vous invite à faire le point sur les différents éléments de l'écosystème Hadoop et leurs rôles respectifs.Egalement, elle vous aidera à comprendre l'architecture des applicatifs hadoop et à savoir quels sont les apports et les cas d'usage des solutions hadoop.

Tarif

A partir de 750,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...