Formation Hadoop - Hortonworks pour administrateur

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

Cette formation Hadoop Hortonworks vous apportera les compétences et connaissances pour maitriser l'administration d'Hadoop sur une distribution Hortonworks.

Tous les aspects importants sont abordés : les différents modes d'installation , la configuration ,les différents outils , l'administation en détail, la sécurité et enfin l'exploitation au quotidien.

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

Contacter l'organisme

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Programme

Introduction

Les fonctionnalités du framework Hadoop.
Les différentes versions.
Distributions : Apache, Cloudera, Hortonworks, EMR, MapR, DSE.
Spécificités de chaque distribution.
Architecture et principe de fonctionnement.
Terminologie : NameNode, DataNode, ResourceManager, NodeManager.
Rôle des différents composants.
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Oozie, Pig, Hive, HBase, ...

Les outils Hadoop

Infrastructure/Mise en oeuvre :
Avro, Ambari, Zookeeper, Pig, Tez, Oozie, Falcon, Pentaho
Vue d'ensemble
Gestion des données.
Exemple de sqoop.
Restitution : webhdfs, hive, Hawq, Mahout,ElasticSearch ..

Outils complémentaires:

Spark, SparkQL, SparkMLib, Storm, BigTop, Zebra

De développement:

Cascading, Scalding, Flink/Pachyderm

D'analyse :

RHadoop, Hama, Chukwa, kafka

Installation et configuration

Trois modes d'installation : local, pseudo-distribué, distribué
Première installation.
Mise en oeuvre avec un seul noeud Hadoop.

Configuration de l'environnement,étude des fichiers de configuration :

core-site.xml, hdfs-site.xml, mapred-site.xml, yarn-site.xml et capacity-scheduler.xml
Création des users pour les daemons hdfs et yarn,droits d'accès sur les exécutables et répertoires.
Lancement des services.
Démarrage des composants : hdfs, hadoop-daemon, yarn-daemon, etc ..

Gestion de la grappe, différentes méthodes :

Ligne de commandes, API Rest, serveur http intégré, APIS natives
Exemples en ligne de commandes avec hdfs, yarn, mapred
Présentation des fonctions offertes par le serveur http

Travaux pratiques :

Organisation et configuration d'une grappe hadoop

Administration Hadoop

Outils complémentaires à yarn et hdfs : jConsole, jconsole yarn
Exemples sur le suivi de charges, l'analyse des journaux.
Principe de gestion des noeuds, accès JMX.

Travaux pratiques :

Mise en oeuvre d'un client JMX

Administration HDFS :

Présentation des outils de stockage des fichiers, fsck, dfsadmin
Mise en oeuvre sur des exemples simples de récupération de fichiers
Gestion centralisée de caches avec Cacheadmin
Déplacement d'un NameNode. Mise en mode maintenance.

Haute disponibilité

Mise en place de la haute disponibilité sur une distribution Ambari.

Travaux pratiques :

Passage d'un système HDFS en mode HA

Sécurité

Mécanismes de sécurité et mise en oeuvre pratique :
Activation de la sécurité avec Kerberos dans core-site.xml, et dans hdfs-site.xml pour les NameNode et DataNode. Sécurisation de yarn avec la mise en oeuvre d'un proxy et d'un Linux Container Executor.

Travaux pratiques :

Mise en place de la sécurité Kerberos sur une distribution Ambari. Création des utilisateurs. Travaux sur les droits d'accès et les droits d'exécution. Impact au niveau des files Yarn, Oozie et Tez.

Exploitation

Installation d'une grappe Hadoop avec Ambari. Tableau de bord. Lancement des services.
Principe de la supervision des éléments par le NodeManager.
Monitoring graphique avec Ambari.
Présentation de Ganglia,Kibana

Travaux pratiques :

Visualisation des alertes en cas d'indisponibilité d'un noeud.
Configuration des logs avec log4j.

Prérequis

Pour suivre ce cours dans de bonnes conditions il vous faut avoir de certaines connaissance des commandes des systèmes unix/linux.

Public

Cette formation Hadoop s'adresse aux Chefs de projet, administrateurs ainsi qu'à toute personne souhaitant mettre en oeuvre un système distribué avec Hadoop.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Comprendre les mécanismes de sécurité Hadoop
  • Les mettre en œuvre
Tarif

A partir de 790,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Maîtriser le rôle, les missions et les responsabilités de l’administrateur mutualiste
Intégrer les exigences de gouvernance applicables à l’activité d’assurance
Participer activement à la prise de décision au sein du Conseil d’administration

Tarif

A partir de 1 095,00 €

Durée

1 jour - 7 heures

Modes
  • Entreprise

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

SPIP est la plate-forme de gestion de contenu éditorial en ligne de référence, proposé en licence Open Source. Cette formation Administrateur SPIP, stage pratique de 3 jours, vous apprendra notamment à : Placer aisément et instantanément un contenu éditorial en ligne - textes, images, documents, objets multimédia dans un site web, intranet, extranet ou CDROM Comprendre la notion de projet de mise en ligne de contenu éditorial. Utiliser la partie privée du site pour valider le contenu rédigé par les rédacteurs. Gérer l'arborescence du site et organiser les contributeurs. Administrer et référencer le site. Cette formation SPIP replace le site dans le projet éditorial et les tâches du comité de rédaction.

Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation MariaDB Développement SQL vous aurez acquis les connaissances et les compétences nécessaires pour : 

  • Vous connecter au serveur puis à la base de données
  • Construire une base de données exemple
  • Apprendre ou perfectionner l’utilisation du langage SQL STANDARD (selon votre niveau initial)
  • Utiliser le SQL STANDARD pour n’importe quel SGBDR
Tarif

A partir de 1 860,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation Stormshield Network Administrateur E-Learning vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Prendre en main un firewall Stormshield Network Security (SNS) et connaître son fonctionnement
  • Configurer un firewall dans un réseau
  • Définir et mettre en œuvre des politiques de filtrage et de routage
  • Configurer un contrôle d'accès aux sites web en http et https (proxy)
  • Configurer des politiques d'authentification
  • Mettre en place différents types de réseaux privés virtuels (VPN IPSEC et VPN SSL)
Tarif

A partir de 600,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Formation DB2 LUW : Les Fondamentaux

Proposé par PLB CONSULTANT

Objectifs de la formation

Concrètement, à l'issue de cette formation DB2 Fondamentaux, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Lister et décrire les composants majeurs de la base de données relationnelle d'IBM : DB2
  • Expliquer les caractéristiques de la table DB2
  • Présenter les concepts de base de la modélisation des données
  • Etat des instructions des process appliquées à DB2 via du SQL simple
  • Lister et décrire les différentes possibilités pour construire (écrire) et exécuter SQL
  • Lister et décrire les étapes nécessaires pour inclure SQL dans un programme
  • Expliquer certaines des fonctions exercées et les responsabilités des administrateurs des bases de données et du système
  • Apporter les connaissances de base en vue d'une formation DB2 avancée
Tarif

A partir de 1 590,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Décrire l'architecture et identifier les composants d'Apache Hadoop
  • Configurer et superviser les services
  • Identifier et manipuler les outils de développement et de supervision Hadoop
  • Exploiter et orchestrer les développements
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Hadoop

Proposé par Sparks

Objectifs de la formation

  • Comprendre l'écosystème Big Data, Hadoop et ses composants
  • Connaître les composants Hadoop et les distributions du marché
  • Installer Hadoop, son infrastructure, gérer un cluster
  • Surveiller l'état du cluster
  • Utiliser Hive, Pig et Oozie
  • Optimiser l'éxécution de vos travaux
Tarif

A partir de 2 100,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Hadoop HBase, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Positionner Hbase dans l’écosystème Hadoop
  • Comprendre l’architecture et le fonctionnement de HBase
  • Identifier les avantages de HBase pour le stockage distribué des données
  • Savoir dialoguer avec un système Hbase (shell)
  • Mettre en place un cluster Hbase en mode distribué
  • Comprendre comment Hbase est utilisé en production par les applications
Tarif

A partir de 1 410,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...