Big Data - Architecture et infrastructure Hadoop

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Exploiter les architectures Big Data Hadoop On-Premise et Cloud
  • Mettre en place des socles techniques complets pour des projets Big Data.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Présentation du Big Data et d'Hadoop

  • Introduction au Big Data : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data
  • Les acteurs du Big Data
  • Exemples pratiques
  • Démystification du Big Data
  • Les technologies concernées
  • Les outils Hadoop
  • Les différents métiers du Big Data
  • Les distributions Big Data
  • Démonstration de traitements avec Hadoop

Jour 2

Solutions Big Data avec Hadoop

  • Projets, applications, plateformes
  • Solutions de stockage des données
  • Considérations Hardware
    • Stockage
    • CPU
    • Mémoire
    • Réseau
    • Systèmes distribués
  • La science et l'art de l'analyse prédictive
  • Aspects économiques (OPEX, CAPEX, TRI)

Jour 3

Architecture cluster applicative et technique avec Hadoop

  • Les différentes étapes de gestion des données
  • Les outils du marché
  • L'ingestion
  • Le stockage
  • La transformation
  • La restitution et la visualisation

Jour 4

Installation et configuration d'un cluster Hadoop On-Premise et sur le Cloud Hadoop

  • Installation d'une plateforme Hadoop
    • Définir l'architecture
    • Installation d'Hadoop / HDFS et d'autres composants
    • Installation des principaux composants (Hive, Pig, Impala...)
  • Configuration de l'environnement
    • Etude des fichiers de configuration
    • Modes de configuration (ligne de commandes, API Rest, serveur HTTP intégré, API natives)
    • Configuration des services (HDFS, YARN, logs...)
    • Configuration des droits d'accès

Configuration d'un cluster hybride On-Premise / Cloud

  • Configuration d'Hadoop
  • Configuration de l'infrastructure Cloud

Jour 5

Administration d'un cluster Hadoop

  • Gestion des ressources (noeuds, disques, CPU, mémoire, réseau...)
  • Administration de HDFS
  • Administration de MapReduce
  • Infrastructure physique des centres de données, serveurs, racks, réseaux
  • Optimisation au niveau du cluster (HDFS, MapReduce), noeuds / OS et réseau (binding, jumbo frames)
  • Planification des stratégies de sécurité et de récupération des données et de reprise sur panne

Exemples de travaux pratiques (à titre indicatif)

  • Installation, configuration et administration pas à pas d'un cluster Hadoop On-Premise et de l'infrastructure Cloud associée
  • Data Warehousing avec Sqoop, Hue, Hive, Impala
  • Conception et optimisation d'architectures cluster matérielles (racks / noeuds / CPU / RAM / disques...)
  • Comparatif technico-économique entre une solution On-Premise et une solution Cloud

Examen M2i (en option)

  • Prévoir l'achat de l'examen en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence
  • L'examen n'est pas éligible au CPF, mais permettra néanmoins de valider vos acquis

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation et/ou un examen M2i

Les + de la formation

Un examen M2i permettant de valider vos acquis à l'issue de la formation est disponible sur demande (coût : 120€).

Prérequis

Avoir une connaissance pratique du Shell Linux, des bases du réseau, des bases de données relationnelles.

Public

Administrateurs systèmes, développeurs, architectes et chefs de projets techniques, consultants en Business Intelligence.

Ces formations pourraient vous intéresser

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Power BI pour construire un bon modèle de données pour l'IA
  • Sélectionner les modèles d'IA adaptés aux données et au but recherché
  • Développer et entraîner des modèles sur Azure ML consommables dans Power BI
  • Utiliser le feedback de l'IA pour définir vos nouveaux projets de Data valorisation.
Tarif

A partir de 2 550,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Explorer les options de calcul et de stockage pour les charges de travail en matière d'ingénierie des données dans Azure
  • Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark
  • Effectuer l'exploration et la transformation des données dans Azure Databricks
  • Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Optimiser les performances des requêtes avec des pools SQL dédiés dans Azure Synapse
  • Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
  • Assurer la sécurité de bout en bout avec Azure Synapse Analytics
  • Effectuez un traitement de flux en temps réel avec Stream Analytics
  • Créer des rapports à l'aide de l'intégration Power BI avec Azure Synpase Analytics
  • Exécuter des processus d'apprentissage automatique intégrés dans Azure Synapse Analytics
Tarif

A partir de 2 590,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire la palette des métiers de la Data et leurs spécificités
  • Dimensionner et structurer une équipe de talents de la Data
  • Utiliser les clés pour optimiser l'efficacité de ces talents dans l'entreprise.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Connaître les pratiques de conception d'architectures AWS
  • Identifier les services et fonctions nécessaires pour créer des solutions informatiques résilientes, sécurisées et hautement disponibles dans le Cloud AWS
  • Utiliser AWS Well-Architected Framework pour concevoir des solutions informatiques optimales basées sur des scénarios concrets
  • Optimiser l'efficacité d'une infrastructure basée sur AWS afin d'améliorer les performances et de diminuer les coûts
  • Identifier les services AWS dédiés à la sécurité des comptes, aux réseaux, au calcul, au stockage, aux bases de données, à la surveillance, à l’automatisation, aux conteneurs, aux architectures sans serveur, aux services en périphérie ainsi qu’à la sauvegarde et à la restauration
Tarif

A partir de 2 400,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Windows Server 2022 - Maitriser les nouveautés

Proposé par CIT FORMATION INFORMATIQUE

Objectifs de la formation

Toute personne disposant de compétences Windows Server et devant mettre en œuvre la version 2022.

À l'issue de la formation, le stagiaire sera capable de :

  • Savoir installer Windows Server 2022 ou mettre à niveau une version précédente
  • Pouvoir maîtriser les nouvelles fonctionnalités de Windows Server 2022
  • Comprendre comment exploiter efficacement les serveurs
  • Apprendre à utiliser Windows Server 2022 comme plate-forme applicative
  • Être en mesure de sécuriser une infrastructure Windows Server 2022

Public concerné

Administrateurs Windows Server 2019 ou 2016

Pré-requis

Bonnes connaissances de l’administration des serveurs Windows 2019

Tarif

A partir de 1 410,00 €

Durée

2 jour(s)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Administrer Oracle Data Integrator
  • Illustrer vos développements
  • Gérer les utilisateurs
  • Optimiser des KM.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expérimenter les options de calcul et de stockage pour les workloads de Data Engineering dans Azure
  • Exécuter des requêtes interactives à l'aide de pools SQL sans serveur
  • Effectuer l'exploration et la transformation des données dans Azure Databricks
  • Explorer, transformer et charger des données dans le Data Warehouse à l'aide d'Apache Spark
  • Ingérer et charger des données dans le Data Warehouse
  • Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Intégrer les données à partir des notebooks avec Azure Data Factory ou Azure Synapse Pipelines
  • Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
  • Assurer la sécurité end-to-end avec Azure Synapse Analytics
  • Effectuer un traitement de flux en temps réel avec Stream Analytics
  • Créer une solution de traitement de flux avec Event Hubs et Azure Databricks.
Tarif

A partir de 2 680,00 €

Durée

4j / 28h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Déployer vSphere avec Tanzu
  • Mettre en œuvre VMware Tanzu Mission Control
  • Appliquer les exigences de mise en réseau VMware NSX pour vSphere avec Tanzu
  • Utiliser vSphere avec Tanzu sur NSX-T Data Center
  • Créer et gérer vSphere avec les espaces de noms Tanzu.
  • Déployer et exécuter des applications pour conteneurs sur vSphere avec Tanzu
  • Décrire le service VMware Tanzu Kubernetes Grid
  • Déployer un cluster Tanzu Kubernetes Grid
  • Exécuter et diriger des applications de conteneurs sur un cluster Tanzu Kubernetes Grid
  • Décrire le cycle de vie de vSphere avec Tanzu
  • Utiliser les logs et les commandes CLI pour surveiller et dépanner vSphere avec Tanzu
Tarif

A partir de 2 450,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Comprendre le Big Data et ses enjeux - Savoir déployer Hadoop et son écosystème - Comprendre HDFS, MapReduce - Structurer les données avec HBase - Ecrire des requêtes avec HiveQL
Tarif

A partir de 2 325,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...