Formation - Big Data - L'essentiel

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Entreprise
  • Distance
  • Centre
Sessions
Lieux Partout en France

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Entreprise
  • Distance
  • Centre
Sessions
Lieux Partout en France

Programme

1 - Exemples d'usage pertinent du Big Data

  • Réseaux : Google, Twitter, Youtube...
  • Gestion des clients (CRM) : Vue 360° des clients / Multicanal
  • Sécurité informatiques (étude de logs) : identification des tentatives d'attaques
  • Analyse des logs d'Internet (Web)
  • Profiling d'individus : ADN numérique
  • Compréhension des usages chez les géants de l'Internet et dans les entreprises et organisations
  • Synthèse des critères de succès d'un projet Big Data et des causes d'échec

2 - Définition commune du Big Data selon les grands acteurs du marché

  • Caractéristiques techniques des 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité...)
  • Collecte et traitement des données structurées, semi-structurées et non-déstructurées
  • Transformation des données en informations
  • Création de la valeur à partir des données / Exemple de monétisation
  • Exemple de processus : gestion des données en cycles, de l'acquisition à la gouvernance

3 - Introduction aux architectures des solutions de calcul distribué du Big Data

  • Principe
  • Scalabilité horizontale et verticale / Rupture technologique
  • Architecture de cluster et composants économiques
  • Traitement parallèle des données
  • Enjeux de sécurité des architectures distribuées, lors de l'intégration dans le système informatique des organisations

4 - Technologies de référence du Big Data à connaître

  • Traitement des données par les superordinateurs ou noeuds/clusters (Hadoop)
  • Usage des architectures existantes : avantages et inconvénients
  • Stockage et traitement des données dans le Data Lake : précautions à prendre
  • Différents types de base des données NoSQL
  • Hadoop : un modèle de traitement distribué du Big Data adopté par les grands acteurs de l'informatique : HDFS, YARN, MapReduce...
  • Ecosystème de Hadoop : Pig, Flume, Zookeeper, HBase, Oozie...
  • Analyse de données : 4 types d'analytique
  • Machine Learning / Intelligence artificielle pour l'analytique

5 - Approches de déploiement du Big Data

  • Déploiement sur site : définition des objectifs, choix des solutions d'analyse et d'intégration, présentation des informations / revue des fournisseurs de composants Big Data
  • Déploiement sur site en version distribuée
  • Déploiement dans les plates-formes Cloud Big Data
  • Précautions à prendre (métriques de qualité, système fermé ...)
  • Difficultés techniques à anticiper
  • Validation de la pertinence d'une plate-forme

6 - Synthèse des plates-formes Cloud public du Big Data Analytiques

  • IBM Analytics
  • Amazon Web Services
  • Google Cloud Platform
  • Microsoft Azure
  • Points communs et différents entre les plates-formes Big Data

7 - Qualité des données

  • Bonne pratique internationale de gouvernance des données
  • Qualification des données (temporel, contextuel, liens aux autres données...) / cadres juridiques, formats ouverts et propriétaires
  • Enrichissement avec l'Open Data / WiKiData

8 - Sécurité des données et confidentialité du Big Data

  • Règlementation RGPD à respecter
  • Recommandation des bonnes pratiques de l'organisme international CSA (Cloud Security Alliance) pour le Big Data
  • Panorama des moyens techniques de sécurité des données et d'accès au Datacenter (cryptage et DLP : Data Lost Prevention...)
  • Recommandations de sécurité dans la manipulation des données
  • Recours aux technologies d'IA/ML et Cybersécurité

9 - Impacts du Big Data à anticiper

  • Évolution des données (Internet des objets, mobilité...)
  • Remise en question des bonnes pratiques actuelles
  • Impacts sur les compétences des équipes informatiques en place
  • Nouveaux métiers (Data Scientist, Data Steward...) et compétences nouvelles à acquérir
  • Rôle de la DSI et de la Direction Numérique face à la montée du Big Data et des activités digitales de l'entreprise

Prérequis

Public

  • Responsables de la DSI s'interrogeant sur les apports et le déploiement du Big Data
  • Chefs de projets, Responsables de métiers et consultants souhaitant aborder les projets
  • Toute personne impliquée dans la réflexion et l'étude du Big Data

Ces formations pourraient vous intéresser

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Définir un Data Module sous Cognos Analytics
  • Manipuler les données et les exploiter dans des rapports et des tableaux de bord.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Présenter l'ensemble des concepts d'Oracle Data Integrator
  • Installer et configurer le produit suivant vos besoins
  • Mener à terme une démarche de développement d'un projet ODI.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

• Développer son esprit de synthèse
• Organiser ses idées grâce à un plan détaillé et logique

Tarif

A partir de 1 400,00 €

Durée

Nous contacter

Modes

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Power BI pour construire un bon modèle de données pour l'IA
  • Sélectionner les modèles d'IA adaptés aux données et au but recherché
  • Développer et entraîner des modèles sur Azure ML consommables dans Power BI
  • Utiliser le feedback de l'IA pour définir vos nouveaux projets de Data valorisation.
Tarif

A partir de 2 550,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Formation Data Management

Proposé par Sparks

Objectifs de la formation

  • Comprendre les concepts clés du Data Management
  • Identifier les données de référence et métadonnées pertinentes
  • Définir les rôles et responsabilités en Data Governance
  • Sélectionner une solution de gestion des données appropriée
  • Évaluer la qualité d'un jeu de données
  • Mettre en place une stratégie de Data Quality
  • Comprendre le contexte législatif et réglementaire autour des données
  • Appliquer les principes de sécurité et d'éthique dans la gestion des données
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Détailler les missions et les moyens dont disposent les CSE de moins de 50 salariés pour exercer leur mandat
  • Identifier les droits dont disposent les CSE de moins de 50 salariés pour exercer leur mandat
  • Détailler les attributions et les moyens du CSE en matière de santé-sécurité
  • S'approprier les étapes de la réalisation des enquêtes en matière d'accidents du travail ou de maladies professionnelles
Tarif

A partir de 1 190,00 €

Durée

2 jours

Modes
  • Entreprise
  • Centre
  • Distance

Objectifs de la formation

  • Analyser les exigences de l’ISO 45001, en repérer la logique et les points clés.
  • Identifier les moyens concrets à mettre en œuvre dans l’entreprise pour y répondre.
Tarif

A partir de 1 480,00 €

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Décrire l’analyse de bout en bout dans Microsoft Fabric
  • Utiliser Lakehouses dans Microsoft Fabric
  • Utiliser Apache Spark dans Microsoft Fabric
  • Travailler avec les tables Delta Lake dans Microsoft Fabric
  • Ingérer des données avec Dataflows Gen2 dans Microsoft Fabric
  • Utiliser les pipelines Data Factory dans Microsoft Fabric
Tarif

Contacter l'organisme

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Configurer et gérer un cluster OpenShift 4.x
  • Exécuter des environnements de production à grande échelle
  • Configurer des pools de noeuds de cluster avec des configurations spéciales et vérifier que seuls les workloads destinés à ces pools soient planifiés sur ces noeuds
  • Configurer l'authentification d'entreprise et la gestion des groupes avec les systèmes de gestion des identités LDAP (Lightweight Directory Access Protocol) et OIDC (OpenID Connect) Cloud-native
  • Déployer, gérer et interroger OpenShift Logging, et configurer la transmission des journaux vers des agrégateurs externes et des systèmes de gestion des informations et des événements de sécurité (SIEM)
  • Automatiser la configuration du cluster et le déploiement de l'application à l'aide d'OpenShift GitOps
  • Résoudre des problèmes de performances et de disponibilité des applications et clusters avec OpenShift Monitoring
  • Configurer et automatiser des sauvegardes au niveau de l'application à l'aide de l'opérateur OADP (OpenShift API for Data Protection).
Tarif

Contacter l'organisme

Durée

5j / 26h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • S'approprier le fonctionnement des CSE de plus de 50 salariés
  • S'approprier les attributions et les moyens du CSE en matière de santé-sécurité
  • Identifier les étapes de la réalisation des missions d'enquête et d'inspection
  • Cerner les risques afin de participer à la démarche de prévention de l'entreprise
  • Choisir les canaux de communication avec la direction et les salariés
Tarif

A partir de 2 300,00 €

Durée

5 jours

Modes
  • Entreprise
  • Centre
  • Distance

Je cherche à faire...