Formation Hadoop

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre l'écosystème Big Data, Hadoop et ses composants
  • Connaître les composants Hadoop et les distributions du marché
  • Installer Hadoop, son infrastructure, gérer un cluster
  • Surveiller l'état du cluster
  • Utiliser Hive, Pig et Oozie
  • Optimiser l'éxécution de vos travaux

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 2 100,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 2 100,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Hadoop est le framework open source d'Apache pour le stockage des données le plus utilisé dans le monde du Big Data. Il permet le stockage et le traitement de vastes quantités de données en un temps court. Apache Hadoop offre des avantages considérables aux organismes disposant de quantités importantes de données. Grâce à notre formation Apache Hadoop de 3 jours, stockez, gérez et traitez vos données rapidement et à moindre coût !

Programme

Présentation Apache Hadoop

Retour historique sur le du Big Data
Exploiter les données

Composants Hadoop

Écosystème Apache Hadoop

HDFS: Architecture
MapReduce : principes, architecture
HBase

Hive

Pig
Sqoop

Les distributions principales du marché

Hortonworks
MapR
Cloudera

Infrastructure Hadoop: Mise en place

Organiser un cluster

Réseau
Besoins matériels
Bien choisir le matériel

Installer et configurer Hadoop

Prérequis
Cloudera Manager

Surveillance du cluster

Développement Hadoop

Hive

Créer des bases de données
Créer des tables
Créer des vues
HiveSQL pour les requêtes
UDF pour manipuler les fonctions définies par l’utilisateur
Gérer les droits utilisateurs

Pig

Interroger les données avec Pig Latin
Communication entre Pig et Hive

Oozie

Planification des travaux
Workflows
Coordinateurs
Bundles

Optimisation de l’exécution des travaux

Hive pour partitionner les données
Archivage
JVM pour gérer la mémoire

Prérequis

Connaissances en SQL.

Public

Administrateurs systèmes et réseaux,

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Développer une application de traitements distribués sur de gros volumes de données ;
  • Configurer et optimiser Hadoop pour chaque besoin ;
  • Organiser et construire un cluster Hadoop ;
  • Prototyper et intégrer rapidement de nouveaux besoins grâce à Hadoop Streaming et Python.
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les principales tâches et responsabilités d'un Data Engineer
  • Comprendre les concepts fondamentaux du traitement et stockage des données
  • Connaître les outils et technologies couramment utilisés en Data Engineering
Tarif

Contacter l'organisme

Durée

1 jour

Modes
  • Centre
  • Entreprise

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Charger et récupérer des données de HBase et du système de fichiers distribué Hadoop (HDFS) - User Defined Functions de Hive et Pig
Tarif

A partir de 2 075,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Décrire l'architecture et identifier les composants d'Apache Hadoop
  • Configurer et superviser les services
  • Identifier et manipuler les outils de développement et de supervision Hadoop
  • Exploiter et orchestrer les développements
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

- Manipuler des ensembles de données complexes stockés dans Hadoop sans avoir à  écrire de code complexe avec Java - Automatiser le transfert des données dans le stockage Hadoop avec Flume et Sqoop - Filtrer les données avec les opérations Extract-Transform-Load (ETL) avec Pig - Interroger plusieurs ensembles de données pour une analyse avec Pig et Hive
Tarif

A partir de 2 760,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

3 jours (21 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

- Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à  partir de sources de données internes et externes - Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées - Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé
Tarif

A partir de 3 450,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Appréhender l'univers des bases de données NoSQL
  • Identifier les caractéristiques techniques de bases NoSQL
  • Différencier bases de données SQL et NoSQL
  • Savoir choisir un type de base de données selon son contexte
  • Connaître les principales solutions NoSQL du marché
Tarif

A partir de 1 400,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...