Formation Analyse du Big Data en environnement Hadoop

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

Cette formation Big Data Analyse vous apportera les connaissances et compétences nécessaires pour:

  • Comprendre le fonctionnement d'Hadoop Distributed File System (HDFS) et YARN/MapReduce
  • Explorer HDFS
  • Suivre l’exécution d’une application YARN
  • Maitriser le fonctionnnement et l'utilisation des différents outils de manipulation de la donnée :
    • Hue : Utilisation de l’interface unifiée
    • Hive, Pig : Les générateurs de MapReduce
    • Tez : L’optimisation des générateurs de MapReduce
    • Sqoop : Comment importer les données de l’entreprise dans un cluster Hadoop?
    • Oozie : Comment organiser les exécutions des différentes applications ?

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 2 400,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 2 400,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Programme

Introduction à Hadoop

Présentation générale d’Hadoop
Exemples d’utilisation dans différents secteurs
Historique et chiffres clés : Quand parle-t-on de Big Data ?

L'écosystème d'Hadoop

Le système de fichier HDFS
Le paradigme MapReduce et l’utilisation à travers YARN

Manipulation des données dans un cluster Hadoop

Hue : Comment fonctionne cette interface web ?
Hive : Pourquoi Hive n’est pas une base de données ?

Requête sur Hive

Utilisation de HCatalog
Utilisation avancée sur Hive
Utilisation de fonctions utilisateurs
Paramétrage de requête
Pig : Fonctionnement de Pig

Programmation avec Pig Latin

Utilisation du mode Local
Utilisation de fonctions utilisateurs
Tez : Qu’est-ce que Tez ?

Comment et quand l’utiliser ?

Oozie : Fonctionnement de Oozie

Création de Workflows avec Oozie

Manipulation des workflows
Ajout d’éléments d’exploitation dans les workflows
Ajout de conditions d’exécution
Paramétrage des workflows
Sqoop : A quoi sert Sqoop ?

Chargement des données depuis une base de données relationnelle

Chargement des données depuis Hadoop
Utilisation et paramétrage avancée
Les particularités des distributions : Impala, Hawq
Quelles sont les bonnes pratiques d’utilisation des différents outils ?

Prérequis

Cecours nécessite d'avoir une expérience dans la manipulation de données. Une connaissance préliminaire d’Hadoop n’est pas exigée mais recommandée.

Public

Cette formation Big Data Analyse de données en environnement Hadoop est destinée aux personnes qui devront manipuler les données dans un cluster Apache Hadoop.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Appliquer les principes de détermination du résultat fiscal et la connexion entre fiscalité et comptabilité
  • Etablir la liasse fiscale
  • Elaborer les documents de gestion pour en analyser les principaux agrégats
Tarif

A partir de 2 555,00 €

Durée

3 jours

Modes
  • Entreprise
  • Centre
  • Distance

Objectifs de la formation

À l'issue de cette formation Vue.js, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Améliorer une page existante de façon non obstrusive, comme le permettrait jQuery
  • Construire un templating dynamique et automatique de toute la page, comme le ferait Angular.JS 1
  • Créer vos propres widgets réutilisables et intégrer ceux de la communauté pour aboutir à une architecture complètement basée sur des composants réutilisables, comme avec React.JS.
  • Comprendre la philosophie et les apports de Vue.js par rapport à d’autres frameworks (jQuery, Angular, React…)
  • Savoir implémenter Vue.js au sein d’un environnement de développement JavaScript cohérent
  • Savoir développer une Single Page App (SPA) à l’aide de Vue.js
  • Être capable de construire un templating dynamique et automatique d’applications web
  • Savoir créer et intégrer des widgets réutilisables
  • Connaître et mettre en œuvre les bonnes pratiques de développement Vue.js
Tarif

A partir de 1 950,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre l'approche par les risques
  • Faire le lien entre normes ISO et exigence, risque et opportunité
  • Réaliser une analyse du risque et mettre en place un plan de maitrise
  • Intégrer la démarche au Système de Management de la Qualité (SMQ)
Tarif

A partir de 1 390,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Scala

Proposé par Sparks

Objectifs de la formation

  • Identifier les caractéristiques clés et les applications du langage Scala
  • Configurer un environnement de développement Scala
  • Comprendre et appliquer les concepts de base de la syntaxe de Scala
  • Utiliser les principes de la programmation fonctionnelle
  • Écrire et transformer des for-expressions et for-loops en Scala
  • Démontrer la compréhension et l'application de l'héritage et des traits dans Scala
  • Appliquer le Pattern Matching dans Scala
  • Maîtriser les concepts avancés de Scala
Tarif

A partir de 1 800,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Connu pour sa capacité de traitement en temps réél, le framework Apache Storm se distingue par sa capacité à effectuer des calculs complexes, de l'analyse, et à traiter les flux de données reapidement et de façon fiable. Storm répond ainsi efficacement aux problématiques du Big Data.

À l'issue de cette formation Storm, vous saurez ainsi :

  • Mettre en œuvre Storm pour le traitement de flux de données
  • Installer un cluster Storm et assurer la Haute Disponibilité
Tarif

A partir de 1 310,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Décrire les composants, architecture et nature d'une solution de BI
  • Créer une base de données multidimensionnelle avec Analysis Services
  • Créer et configurer des cubes et des dimensions
  • Créer et configurer des mesures et des groupes de mesures dans un cube
  • Interroger un cube avec MDX
  • Personnaliser un cube
  • Créer une base de données tabulaire avec Analysis Services
  • Utiliser DAX pour personnaliser un modèle tabulaire
  • Décrire l'analyse prédictive avec Data Mining
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Découvrir et utiliser la puissance prédictive des modèles ensemblistes
  • Savoir effectuer un "feature engineering" performant
  • Appréhender les techniques de text-mining et de deep-learning à travers d'exemples concrets
  • Enrichir ses outils de data scientist
Tarif

A partir de 2 500,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Qualité Réseaux Mobiles, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Décrire les caractéristiques et spécificités de réseaux radio mobile, la Qualité de service, le roaming, la facturation
  • Différencier les différents critères de performance (KPI) dans les réseaux
  • Identifier et détecter les dégradations dans la partie d’accès des réseaux radio mobiles
  • Présenter les chaines de mesure Drive Test et les outils de post-traitements des mesures
  • Réaliser des analyses et investigations pour l’amélioration et l’optimisation de la qualité de service radio
Tarif

A partir de 1 860,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre les spécificités du traitement de données en temps réel
  • Connaître les différents composants et l'architecture d'un système de data streaming
  • Construire des pipelines pour le traitement de données en continu avec Kafka, Airflow ou Spark
Tarif

A partir de 3 000,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...