Formation - Big Data - L'essentiel

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche

Tarif

Contacter l'organisme

Durée 2 jours (14 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Programme

1 - Exemples d'usage pertinent du Big Data

  • Réseaux : Google, Twitter, Youtube...
  • Gestion des clients (CRM) : Vue 360° des clients / Multicanal
  • Sécurité informatiques (étude de logs) : identification des tentatives d'attaques
  • Analyse des logs d'Internet (Web)
  • Profiling d'individus : ADN numérique
  • Compréhension des usages chez les géants de l'Internet et dans les entreprises et organisations
  • Synthèse des critères de succès d'un projet Big Data et des causes d'échec

2 - Définition commune du Big Data selon les grands acteurs du marché

  • Caractéristiques techniques des 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité...)
  • Collecte et traitement des données structurées, semi-structurées et non-déstructurées
  • Transformation des données en informations
  • Création de la valeur à partir des données / Exemple de monétisation
  • Exemple de processus : gestion des données en cycles, de l'acquisition à la gouvernance

3 - Introduction aux architectures des solutions de calcul distribué du Big Data

  • Principe
  • Scalabilité horizontale et verticale / Rupture technologique
  • Architecture de cluster et composants économiques
  • Traitement parallèle des données
  • Enjeux de sécurité des architectures distribuées, lors de l'intégration dans le système informatique des organisations

4 - Technologies de référence du Big Data à connaître

  • Traitement des données par les superordinateurs ou noeuds/clusters (Hadoop)
  • Usage des architectures existantes : avantages et inconvénients
  • Stockage et traitement des données dans le Data Lake : précautions à prendre
  • Différents types de base des données NoSQL
  • Hadoop : un modèle de traitement distribué du Big Data adopté par les grands acteurs de l'informatique : HDFS, YARN, MapReduce...
  • Ecosystème de Hadoop : Pig, Flume, Zookeeper, HBase, Oozie...
  • Analyse de données : 4 types d'analytique
  • Machine Learning / Intelligence artificielle pour l'analytique

5 - Approches de déploiement du Big Data

  • Déploiement sur site : définition des objectifs, choix des solutions d'analyse et d'intégration, présentation des informations / revue des fournisseurs de composants Big Data
  • Déploiement sur site en version distribuée
  • Déploiement dans les plates-formes Cloud Big Data
  • Précautions à prendre (métriques de qualité, système fermé ...)
  • Difficultés techniques à anticiper
  • Validation de la pertinence d'une plate-forme

6 - Synthèse des plates-formes Cloud public du Big Data Analytiques

  • IBM Analytics
  • Amazon Web Services
  • Google Cloud Platform
  • Microsoft Azure
  • Points communs et différents entre les plates-formes Big Data

7 - Qualité des données

  • Bonne pratique internationale de gouvernance des données
  • Qualification des données (temporel, contextuel, liens aux autres données...) / cadres juridiques, formats ouverts et propriétaires
  • Enrichissement avec l'Open Data / WiKiData

8 - Sécurité des données et confidentialité du Big Data

  • Règlementation RGPD à respecter
  • Recommandation des bonnes pratiques de l'organisme international CSA (Cloud Security Alliance) pour le Big Data
  • Panorama des moyens techniques de sécurité des données et d'accès au Datacenter (cryptage et DLP : Data Lost Prevention...)
  • Recommandations de sécurité dans la manipulation des données
  • Recours aux technologies d'IA/ML et Cybersécurité

9 - Impacts du Big Data à anticiper

  • Évolution des données (Internet des objets, mobilité...)
  • Remise en question des bonnes pratiques actuelles
  • Impacts sur les compétences des équipes informatiques en place
  • Nouveaux métiers (Data Scientist, Data Steward...) et compétences nouvelles à acquérir
  • Rôle de la DSI et de la Direction Numérique face à la montée du Big Data et des activités digitales de l'entreprise

Prérequis

Public

  • Responsables de la DSI s'interrogeant sur les apports et le déploiement du Big Data
  • Chefs de projets, Responsables de métiers et consultants souhaitant aborder les projets
  • Toute personne impliquée dans la réflexion et l'étude du Big Data

Ces formations pourraient vous intéresser

Formation Kedro

Proposé par Sparks

Objectifs de la formation

  • Comprendre les principes de développement utiles aux ingénieurs data et data scientists pour faciliter le déploiement de leur code en production
  • S’approprier les principales fonctionnalités de Kedro (project template, configuration, data catalog et pipeline)
  • Mettre en œuvre l’outil dans un workflow pour créer des pipelines de données
Tarif

A partir de 750,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des flux simples de l'ETL Data Services.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expliquer comment Unifed Manager vous permet de surveiller le bon fonctionnement de votre infrastructure de stockage
  • Utiliser l'efficacité des routines WorkFlow Automation
  • Vous préparer à la certification NS0-527 Certification NCIE Data Protection.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

Toute personne Référent/Tuteur dans une entreprise en situation de transmission des savoirs (savoirs/savoir-faire et savoir-être).

La formation permettra d’acquérir les notions nécessaires afin d’assurer la fonction de tuteur dans l'entreprise :

  • Comprendre son rapport aux autres et prendre conscience de son fonctionnement avec l’outil de Diagnostic Exécutive Profiler
  • Acquérir des outils et méthodes d'accompagnement individuel
  • Concevoir le processus de transfert de compétence
  • Accompagner pour développer les compétences et évaluer l’autonomie
Tarif

A partir de 1 655,00 €

Durée

3 jour(s)

Modes
  • Entreprise
  • Distance
  • Centre

Azure Data Factory

Proposé par M2I

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Découvrir la plateforme Azure Data Factory
  • Préparer, collecter et extraire les données
  • Travailler les données
  • Administrer et monitorer.
Tarif

A partir de 2 130,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications décisionnelles Qlik Sense permettant d'analyser des données provenant du monde du Big Data
  • Mettre en place une connexion de données Big Data Qlik Sense
  • Concevoir et modéliser un modèle de base de données Qlik Sense
  • Construire une interface de Data Visualisation sous Qlik Sense.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Scikitlearn pour créer des modèles d'apprentissage machine
  • Concevoir des expériences et interpréter les résultats des tests A/B
  • Visualiser l'analyse de clustering et de régression en Python à l'aide de Matplotlib
  • Produire des recommandations automatisées de produit ou de contenu avec des techniques de filtrage collaboratif
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Écrire des scripts Python pour automatiser des tâches
  • Mettre en œuvre de façon efficace la programmation orientée objets de Python ainsi que les particularités du langage
  • Comprendre le rôle des librairies standards
  • Développer vos propres applications de Data Science et d’Intelligence Artificielle.
Tarif

A partir de 2 050,00 €

Durée

3j / 21h

Modes
  • Entreprise

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire le concept du Big Data
  • Extraire et exploiter les datas
  • Evaluer l'impact pour les Systèmes d'Information (SI) de l'entreprise
  • Appliquer la réglementation.
Tarif

A partir de 860,00 €

Durée

1j / 7h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser les nouvelles fonctionnalités de l'architecture multi-tenant
  • Identifier les nouvelles fonctionnalités de la sécurité des base de données et de RMAN
  • Distinguer les nouvelles fonctionnalités du Data Warehousing et les améliorations apportées au Sharding.
Tarif

A partir de 1 220,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Je cherche à faire...