Formation - Big Data - L'essentiel
Prérequis
- Connaissances sommaires en informatique
- Disposez-vous des connaissances nécessaires pour suivre cette formation ? Testez-vous !
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En entreprise
- À distance
- En centre
Objectifs pédagogiques
- Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Programme de la formation
1 - Exemples d'usage pertinent du Big Data
- Réseaux : Google, Twitter, Youtube...
- Gestion des clients (CRM) : Vue 360° des clients / Multicanal
- Sécurité informatiques (étude de logs) : identification des tentatives d'attaques
- Analyse des logs d'Internet (Web)
- Profiling d'individus : ADN numérique
- Compréhension des usages chez les géants de l'Internet et dans les entreprises et organisations
- Synthèse des critères de succès d'un projet Big Data et des causes d'échec
2 - Définition commune du Big Data selon les grands acteurs du marché
- Caractéristiques techniques des 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité...)
- Collecte et traitement des données structurées, semi-structurées et non-déstructurées
- Transformation des données en informations
- Création de la valeur à partir des données / Exemple de monétisation
- Exemple de processus : gestion des données en cycles, de l'acquisition à la gouvernance
3 - Introduction aux architectures des solutions de calcul distribué du Big Data
- Principe
- Scalabilité horizontale et verticale / Rupture technologique
- Architecture de cluster et composants économiques
- Traitement parallèle des données
- Enjeux de sécurité des architectures distribuées, lors de l'intégration dans le système informatique des organisations
4 - Technologies de référence du Big Data à connaître
- Traitement des données par les superordinateurs ou noeuds/clusters (Hadoop)
- Usage des architectures existantes : avantages et inconvénients
- Stockage et traitement des données dans le Data Lake : précautions à prendre
- Différents types de base des données NoSQL
- Hadoop : un modèle de traitement distribué du Big Data adopté par les grands acteurs de l'informatique : HDFS, YARN, MapReduce...
- Ecosystème de Hadoop : Pig, Flume, Zookeeper, HBase, Oozie...
- Analyse de données : 4 types d'analytique
- Machine Learning / Intelligence artificielle pour l'analytique
5 - Approches de déploiement du Big Data
- Déploiement sur site : définition des objectifs, choix des solutions d'analyse et d'intégration, présentation des informations / revue des fournisseurs de composants Big Data
- Déploiement sur site en version distribuée
- Déploiement dans les plates-formes Cloud Big Data
- Précautions à prendre (métriques de qualité, système fermé ...)
- Difficultés techniques à anticiper
- Validation de la pertinence d'une plate-forme
6 - Synthèse des plates-formes Cloud public du Big Data Analytiques
- IBM Analytics
- Amazon Web Services
- Google Cloud Platform
- Microsoft Azure
- Points communs et différents entre les plates-formes Big Data
7 - Qualité des données
- Bonne pratique internationale de gouvernance des données
- Qualification des données (temporel, contextuel, liens aux autres données...) / cadres juridiques, formats ouverts et propriétaires
- Enrichissement avec l'Open Data / WiKiData
8 - Sécurité des données et confidentialité du Big Data
- Règlementation RGPD à respecter
- Recommandation des bonnes pratiques de l'organisme international CSA (Cloud Security Alliance) pour le Big Data
- Panorama des moyens techniques de sécurité des données et d'accès au Datacenter (cryptage et DLP : Data Lost Prevention...)
- Recommandations de sécurité dans la manipulation des données
- Recours aux technologies d'IA/ML et Cybersécurité
9 - Impacts du Big Data à anticiper
- Évolution des données (Internet des objets, mobilité...)
- Remise en question des bonnes pratiques actuelles
- Impacts sur les compétences des équipes informatiques en place
- Nouveaux métiers (Data Scientist, Data Steward...) et compétences nouvelles à acquérir
- Rôle de la DSI et de la Direction Numérique face à la montée du Big Data et des activités digitales de l'entreprise

Proposé par
IB Cegos
"Formations aux technologies et métiers du Numérique"

Proposé par
IB Cegos
