Big Data - Architecture et infrastructure Hadoop

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Exploiter les architectures Big Data Hadoop On-Premise et Cloud
  • Mettre en place des socles techniques complets pour des projets Big Data.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Présentation du Big Data et d'Hadoop

  • Introduction au Big Data : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data
  • Les acteurs du Big Data
  • Exemples pratiques
  • Démystification du Big Data
  • Les technologies concernées
  • Les outils Hadoop
  • Les différents métiers du Big Data
  • Les distributions Big Data
  • Démonstration de traitements avec Hadoop

Jour 2

Solutions Big Data avec Hadoop

  • Projets, applications, plateformes
  • Solutions de stockage des données
  • Considérations Hardware
    • Stockage
    • CPU
    • Mémoire
    • Réseau
    • Systèmes distribués
  • La science et l'art de l'analyse prédictive
  • Aspects économiques (OPEX, CAPEX, TRI)

Jour 3

Architecture cluster applicative et technique avec Hadoop

  • Les différentes étapes de gestion des données
  • Les outils du marché
  • L'ingestion
  • Le stockage
  • La transformation
  • La restitution et la visualisation

Jour 4

Installation et configuration d'un cluster Hadoop On-Premise et sur le Cloud Hadoop

  • Installation d'une plateforme Hadoop
    • Définir l'architecture
    • Installation d'Hadoop / HDFS et d'autres composants
    • Installation des principaux composants (Hive, Pig, Impala...)
  • Configuration de l'environnement
    • Etude des fichiers de configuration
    • Modes de configuration (ligne de commandes, API Rest, serveur HTTP intégré, API natives)
    • Configuration des services (HDFS, YARN, logs...)
    • Configuration des droits d'accès

Configuration d'un cluster hybride On-Premise / Cloud

  • Configuration d'Hadoop
  • Configuration de l'infrastructure Cloud

Jour 5

Administration d'un cluster Hadoop

  • Gestion des ressources (noeuds, disques, CPU, mémoire, réseau...)
  • Administration de HDFS
  • Administration de MapReduce
  • Infrastructure physique des centres de données, serveurs, racks, réseaux
  • Optimisation au niveau du cluster (HDFS, MapReduce), noeuds / OS et réseau (binding, jumbo frames)
  • Planification des stratégies de sécurité et de récupération des données et de reprise sur panne

Exemples de travaux pratiques (à titre indicatif)

  • Installation, configuration et administration pas à pas d'un cluster Hadoop On-Premise et de l'infrastructure Cloud associée
  • Data Warehousing avec Sqoop, Hue, Hive, Impala
  • Conception et optimisation d'architectures cluster matérielles (racks / noeuds / CPU / RAM / disques...)
  • Comparatif technico-économique entre une solution On-Premise et une solution Cloud

Examen M2i (en option)

  • Prévoir l'achat de l'examen en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence
  • L'examen n'est pas éligible au CPF, mais permettra néanmoins de valider vos acquis

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation et/ou un examen M2i

Les + de la formation

Un examen M2i permettant de valider vos acquis à l'issue de la formation est disponible sur demande (coût : 120€).

Prérequis

Avoir une connaissance pratique du Shell Linux, des bases du réseau, des bases de données relationnelles.

Public

Administrateurs systèmes, développeurs, architectes et chefs de projets techniques, consultants en Business Intelligence.

Ces formations pourraient vous intéresser

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des flux simples de l'ETL Data Services.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Mettre en œuvre les concepts de la programmation fonctionnelle et déclarative
  • Installer et configurer un projet React
  • Développer des interfaces utilisateurs à base de composants
  • Gérer la navigation au sein de l’application
  • Mettre en place une architecture de gestion d’état de l’application avec Redux
  • Tester le code et les composants
Tarif

Contacter l'organisme

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer une architecture de données adaptée aux besoins décisionnels des utilisateurs
  • Réviser tous les fondements pour aborder un projet décisionnel
  • Identifier les concepts de la modélisation par les objets
  • Mesurer les enjeux et impacts d'un projet décisionnel
  • Concevoir et modéliser un entrepôt de données
  • Décrire le rôle des différents outils de l'informatique décisionnelle
  • Reconnaître les pièges à éviter lors de la mise en oeuvre.
Tarif

A partir de 1 420,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Créer une infrastructure informatique sur la plateforme AWS
  • Optimiser le cloud AWS avec les services AWS et la façon dont ils s’intègrent aux solutions cloud
  • Explorer les bonnes pratiques et les modèles de conception du cloud AWS pour vous aider à architecturer des solutions informatiques optimales sur AWS
Tarif

A partir de 2 190,00 €

Durée

3j / 21h

Modes

Objectifs de la formation

  • Décrire l’analyse de bout en bout dans Microsoft Fabric
  • Utiliser Lakehouses dans Microsoft Fabric
  • Utiliser Apache Spark dans Microsoft Fabric
  • Travailler avec les tables Delta Lake dans Microsoft Fabric
  • Ingérer des données avec Dataflows Gen2 dans Microsoft Fabric
  • Utiliser les pipelines Data Factory dans Microsoft Fabric
Tarif

Contacter l'organisme

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser les concepts de ce cours pour simplifier et gérer plus efficacement leurs interactions de services
  • Installer et à configurer Red Hat OpenShift Service Mesh pour définir, surveiller, gérer et sécuriser l'interaction des services au sein de leur architecture de microservices
  • Illustrer la facilité de l'approche "sidecar" de Red Hat OpenShift Service Mesh et mettre en évidence les avantages de la résilience et de la surveillance des services qu'offre le produit.
Tarif

Contacter l'organisme

Durée

4j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire les modèles génératifs et les apports concrets de GPT-4 et ChatGPT
  • Expliquer les architectures des solutions d'IA avec Azure Cognitive Services et Azure OpenAI
  • Invoquer les API Cognitive Services et OpenAI pour créer des applications en Python
  • Implémenter les meilleures pratiques d'Azure Cognitive Services et Azure OpenAI
  • Mettre en pratique les principes de DevOps, MLOps et IAOps
  • Déployer et héberger des services IA sur Azure grâce à des conteneurs.
Tarif

A partir de 4 250,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

Mettre en oeuvre les services Bureau à distance de Windows Server 2019 - Configurer une infrastructure d'haute disponibilité des services Bureau à distance
Tarif

A partir de 3 225,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Définir une stratégie Data ambitieuse et réaliste
  • Evaluer les priorités Data de l'organisation en fonction de l'état des lieux et de la vision
  • Identifier les meilleures technologies disponibles et leur articulation / complémentarité
  • Analyser les besoins et attentes des parties prenantes et implémenter une démarche de transformation DataOps robuste (conduite du changement).
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Identifier les apports de la RPA et son périmètre d'application au sein d'une organisation
  • Découvrir la solution UiPath, son architecture et ses principaux composants : Studio, Orchestrator et Robot
  • S'approprier les étapes clés d'un projet RPA et utiliser les fonctionnalités d'UiPath pour les mettre en œuvre
  • S'entraîner à développer des robots pour imiter le travail d'employés grâce à des exemples concrets d'automatisation
Tarif

A partir de 1 300,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...