Formation Big Data : mise en œuvre

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Pouvoir mettre en oeuvre une solution d'analyse Big Data
  • Comprendre les fondamentaux du Big Data et de son implémentation
  • Utiliser les outils pour la collecte, le stockage et le traitement des données
  • Savoir analyser les données et faire de la datavisualisation

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 3 750,00 €

Durée 5 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 3 750,00 €

Durée 5 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Notre formation Big Data Mise en œuvre couvre l’ensemble des processus nécessaires pour exploiter les ensembles de données massives. Vous découvrirez les différentes technologies pour collecter, stocker, traiter, analyser et présenter la « data », nouvelle ressource stratégique pour les entreprises. Lors des nombreux ateliers pratiques de la formation, vous apprendrez à mettre en œuvre une plateforme complète pour gérer vos données. Travaillez avec Hadoop, Spark ou encore Talend pour la datavisualisation et soyez en mesure de sélectionner les bons outils Big Data selon vos besoins. Une introduction aux concepts d’apprentissage automatique (Machine Learning, Deep Learning) sera également présentée durant la formation.

Programme

Introduction à la formation Big Data Mise en œuvre

Présentation générale et objectifs de cette formation Big Data
Comprendre les enjeux et perspectives du Big Data
Chiffres clés en France et à l’international
La donnée en tant que matière première : « data is the new oil » ?
Différents types, structures et sources de données
Panorama des solutions et acteurs du marché : l’écosystème Big Data
Les nouveaux métiers de la data
Atelier : Présentation du déroulé de la formation et échanges sur les différents contextes des stagiaires.

Rappels des fondamentaux du Big Data

Big Data, Data Science, Machine Learning, etc : définitions et concepts clés
Caractéristiques des données dites massives (les dimensions en V du Big Data)
Les architectures Big Data orientées stockage, calcul, temps réel…
Enjeux juridiques et éthiques liés à la collecte, au traitement et à l’analyse de données
Cycle de vie de la donnée
Assurer la qualité des données
Créer de la valeur à partir des données : vue d’ensemble d’un processus de Data Science
Atelier : Discussions sur les potentiels usages des technologies de Big Data suivant les secteurs d’activité.

Méthodologie pour l’implémentation d’un projet Big Data

Définir les besoins métiers et objectifs d’un projet
Spécificités d’un projet Big Data : incertitude, budget, délais, gestion organisationnelle…
Sélectionner les bons outils
Poser les bonnes questions
Obtenir les données
Explorer et prétraiter les données
Analyser les données : planifier et construire un modèle viable
Communiquer les résultats
Transformer les résultats en décisions et en actions
Exemples de cas pratiques : Présentation du schéma d’architecture d’un projet Big Data et élaboration d’une première feuille de route.

Outils et technologies Big Data : démarrer avec Hadoop

L’écosystème Apache Hadoop et les principales distributions (Hortonworks, Cloudera…)
Clusters Hadoop, HDFS, YARN et MapReduce : comprendre les principes de fonctionnement
Introduction aux composants HBase, Pig et Hive, Spark…
Cas d’utilisation et exemples de mises en œuvre de la plateforme Hadoop.
Exemples de cas pratiques : Installation et configuration d’une plateforme complète Big Data. Prise en main des concepts de base de l’architecture Hadoop (NameNode, DataNode, Replications…).

Collecte, stockage et traitement des données

Connaître les différentes sources de données (internes/externes, publiques/privées)
Analyser les caractéristiques d’un jeu de données
Principes ETL (Extract Transform Load) : présentation et prise en main de Talend
Gérer les spécificités des données semi et non-structurées
Rappels des principes du stockage distribué
Intérêt et vue d’ensemble des bases de données NoSQL (Cassandra, Neo4j, MongoDB…)
Prise en main d’HDFS et du modèle MapReduce
Utiliser les fonctionnalités de Pig et Hive pour requêter et traiter les données
ElasticSearch pour l’indexation et la recherche de données
Exemples de cas pratiques : Mises en pratiques des concepts, prise en main des différents outils pour importer, stocker et manipuler des ensembles de données.

Analyse des données issues du Big Data

Vue d’ensemble des différentes méthodes et techniques d’analyse
Notions d’analyse statistique et prédictive, l’impact de l’augmentation des volumes de données
Analyser un ensemble de données avec l’environnement Apache Spark
Comprendre les apports de la convergence entre Big Data et intelligence artificielle
Introduction aux principes de Machine Learning
Les différentes familles de modèles : régression, classification, clustering, reinforcement learning, NLP
Technique de feature engineering pour préparer les données
Sélectionner, entraîner et tester un algorithme de Machine Learning
Principes du Deep Learning : apprentissage profond et réseaux neuronaux
Exemples de cas pratiques : Présentation de l’environnement Spark. Mise en œuvre d’analyses de données avec des techniques de Machine Learning (langage R ou Python).

Datavisualisation : apprendre à communiquer sur les données

Les enjeux et objectifs d’une bonne communication
Principes fondamentaux de la représentation visuelle
La Datavisualisation tout au long du processus Big Data
Techniques et outils principaux pour la visualisation de données (Tableau, Qlik, etc)
Sélectionner une solution de datavisualisation selon l’objectif recherché
Connaître les bonnes pratiques de Dataviz : utilisation des couleurs, graphiques, tableaux de bord, infographies, notebooks…
Visualisation interactive
Exemple de cas pratique : Utilisation d’une solution de datavisualisation pour réaliser une présentation des résultats d’analyse.

Prérequis

Connaissances en bases de données, en statistiques et en développement (Java ou SQL préférables). Il est recommandé d'avoir suivi notre formation Big Data: état de l'art ou connaissances équivalentes

Public

Administrateurs systèmes et réseaux,

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Comprendre les enjeux de la conduite du changement
  • Élaborer un plan d’accompagnement du changement et le dimensionnement des leviers de la conduite du changement
  • Prévenir les comportements nuisibles face au changement
Tarif

A partir de 1 790,00 €

Durée

2j / 14h

Modes

Objectifs de la formation

  • Maîtriser les étapes de la transformation Lean.
  • Repérer les changements vers une culture Lean.
  • Repérer les gaspillages et s’organiser pour les réduire.
Tarif

A partir de 1 470,00 €

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

À l'issue de cette formation Cisco Wireless, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Décrire et mettre en œuvre une méthodologie de conception structurée recommandée par Cisco
  • Décrire et mettre en œuvre les normes, les modifications, les certifications et les RFC de l'industrie
  • Décrire et mettre en œuvre les fonctions sans fil améliorées de Cisco
  • Décrire et mettre en œuvre le processus de conception de la technologie sans fil
  • Décrire et mettre en œuvre des conceptions verticales spécifiques
  • Décrire et mettre en œuvre les processus d'étude de site
  • Décrire et mettre en œuvre les processus de validation du réseau
Tarif

A partir de 4 090,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Maîtriser PowerPivot et les outils BI avec Excel permettant la mise en place d’une solution adaptée, performante, évolutive, simple à maintenir et simple à utiliser
  • Prototyper une solution BI avant un déploiement Corporate (SSAS)
Tarif

A partir de 1 590,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Configurer et gérer un cluster OpenShift 4.x
  • Exécuter des environnements de production à grande échelle
  • Configurer des pools de noeuds de cluster avec des configurations spéciales et vérifier que seuls les workloads destinés à ces pools soient planifiés sur ces noeuds
  • Configurer l'authentification d'entreprise et la gestion des groupes avec les systèmes de gestion des identités LDAP (Lightweight Directory Access Protocol) et OIDC (OpenID Connect) Cloud-native
  • Déployer, gérer et interroger OpenShift Logging, et configurer la transmission des journaux vers des agrégateurs externes et des systèmes de gestion des informations et des événements de sécurité (SIEM)
  • Automatiser la configuration du cluster et le déploiement de l'application à l'aide d'OpenShift GitOps
  • Résoudre des problèmes de performances et de disponibilité des applications et clusters avec OpenShift Monitoring
  • Configurer et automatiser des sauvegardes au niveau de l'application à l'aide de l'opérateur OADP (OpenShift API for Data Protection).
Tarif

Contacter l'organisme

Durée

5j / 26h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Identifier les leviers contribuant à rendre les achats plus performants dans un contexte qui exige adaptabilité et réactivité de l’entreprise face à un environnement contraint économiquement
  • Maintenir une relation efficace entre Achats et Finances
  • Mettre en œuvre les actions concrètes adéquates
  • Élaborer le plan d’actions et mesurer la performance Achats
Tarif

A partir de 150,00 €

Durée

2 heures 25 minutes

Modes

Objectifs de la formation

  • Comprendre et initialiser TestLink et découvrir ses fonctionnalités.
  • Gérer la traçabilité des exigences et des tests.
  • Concevoir des campagnes de test adaptées.
  • Exécuter les campagnes et produire le reporting.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Acquérir la méthodologie et les outils d’élaboration, de mise en œuvre et de suivi des projets de formation
  • Identifier les besoins et mesurer les résultats de la formation
  • Inscrire la gestion des parcours de formation dans le contexte de la réforme
Tarif

A partir de 1 550,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

  • Comprendre les mécanismes de sécurité Hadoop
  • Les mettre en œuvre
Tarif

A partir de 790,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Connaître les solutions e-marketing, favoriser la génération de trafic et la fidélisation. Mettre en œuvre des outils de visibilité. Développer sa notoriété et mesurer ses retours sur investissement.

Tarif

A partir de 800,00 €

Durée

2 jour(s)

Modes
  • Entreprise
  • Distance
  • Centre

Je cherche à faire...