Formation Hadoop

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre l'écosystème Big Data, Hadoop et ses composants
  • Connaître les composants Hadoop et les distributions du marché
  • Installer Hadoop, son infrastructure, gérer un cluster
  • Surveiller l'état du cluster
  • Utiliser Hive, Pig et Oozie
  • Optimiser l'éxécution de vos travaux

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 2 100,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 2 100,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Hadoop est le framework open source d'Apache pour le stockage des données le plus utilisé dans le monde du Big Data. Il permet le stockage et le traitement de vastes quantités de données en un temps court. Apache Hadoop offre des avantages considérables aux organismes disposant de quantités importantes de données. Grâce à notre formation Apache Hadoop de 3 jours, stockez, gérez et traitez vos données rapidement et à moindre coût !

Programme

Présentation Apache Hadoop

Retour historique sur le du Big Data
Exploiter les données

Composants Hadoop

Écosystème Apache Hadoop

HDFS: Architecture
MapReduce : principes, architecture
HBase

Hive

Pig
Sqoop

Les distributions principales du marché

Hortonworks
MapR
Cloudera

Infrastructure Hadoop: Mise en place

Organiser un cluster

Réseau
Besoins matériels
Bien choisir le matériel

Installer et configurer Hadoop

Prérequis
Cloudera Manager

Surveillance du cluster

Développement Hadoop

Hive

Créer des bases de données
Créer des tables
Créer des vues
HiveSQL pour les requêtes
UDF pour manipuler les fonctions définies par l’utilisateur
Gérer les droits utilisateurs

Pig

Interroger les données avec Pig Latin
Communication entre Pig et Hive

Oozie

Planification des travaux
Workflows
Coordinateurs
Bundles

Optimisation de l’exécution des travaux

Hive pour partitionner les données
Archivage
JVM pour gérer la mémoire

Prérequis

Connaissances en SQL.

Public

Administrateurs systèmes et réseaux,

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Connaître les opportunités et les solutions Big Data actuelles
  • Comprendre les enjeux et les pespectives pour son entreprise
  • Pouvoir stocker, traiter, analyser et visualiser les données
  • Maîtriser les aspects ethiques et juridiques du Big Data
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

12 jours (84 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

- Structurer et concevoir des bases de données Cassandra pour garder une longueur d'avance sur vos concurrents - Appliquer des modèles de requêtes pour modéliser les données de vos bases Cassandra - Accéder aux bases de données Cassandra avec CQL et Java - Trouver le juste équilibre entre le débit de lecture / écriture et la cohérence des données - Intégrer Cassandra à  Hadoop, Pig et Hive - Mettre en oeuvre les design patterns Cassandra les plus courants
Tarif

A partir de 2 070,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Les fondamentaux du NoSQL

Proposé par ENI Service

Objectifs de la formation

  • Identifier les différences entre SGBD SQL et SGBD NoSQL
  • Évaluer les apports et les inconvénients inhérents aux technologies NoSQL
  • Identifier les principaux acteurs et solutions du marché pour chaque modèle de données
  • Appréhender les champs d'application des SGBD NoSQL en opérationnel et en analytique
  • Appréhender les différentes architectures, modèles de données et implémentations techniques
  • Identifier les critères de choix
Tarif

A partir de 1 590,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser HBase avec HDFS
  • Utiliser HBase Shell
  • Désigner les schémas sous HBase
  • Connecter HBase avec d'autres sources pour charger et récupérer des données
  • Appliquer les bonnes pratiques.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

- Intégrer les compostants Big Data pour créer un Data Lake approprié - Sélectionner des entrepôts de Big Data adaptés pour gérer plusieurs ensembles de données - Traiter des ensembles de données volumineux avec Hadoop pour faciliter la prise de décisions techniques et métier - Interroger des ensembles de données volumineux en temps réel
Tarif

A partir de 2 070,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

- Manipuler des ensembles de données complexes stockés dans Hadoop sans avoir à  écrire de code complexe avec Java - Automatiser le transfert des données dans le stockage Hadoop avec Flume et Sqoop - Filtrer les données avec les opérations Extract-Transform-Load (ETL) avec Pig - Interroger plusieurs ensembles de données pour une analyse avec Pig et Hive
Tarif

A partir de 2 760,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Comprendre le Big Data et ses enjeux - Savoir déployer Hadoop et son écosystème - Comprendre HDFS, MapReduce - Structurer les données avec HBase - Ecrire des requêtes avec HiveQL
Tarif

A partir de 2 325,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...