Architectures de données (data architecture) pour le Machine Learning et l'Intelligence Artificielle (IA)
Prérequis
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- À distance
Objectifs pédagogiques
A l'issue de cette formation, vous serez capable de :
- Concevoir une plateforme "Cloud-native" ou hybride pour le Machine Learning et l'IA (Intelligence Artificielle)
- Consolider les actifs Data de l'organisation data-driven dans une seule plateforme
- Démocratiser l'accès aux données et permettre aux équipes métier de produire des modèles de ML (Machine Learning) et d'IA en self-service
- Automatiser la prise de décision dans l'organisation grâce à des pipelines de streaming
- Ajouter des capabilités prédictives et prescriptives aux capabilités descriptives de la BI (Business Intelligence).
Programme de la formation
Jour 1
Fondamentaux de l'IA et des architectures Data
- Qu'est-ce que l'IA ?
- Similarités et différences entre IA et le développement d'applications traditionnelles
- Machine Learning vs Deep Learning
- Batch vs temps réel vs streaming
- De la BI (Business Intelligence) au Big Data aux Business Analytics
- Evolution des plateformes d'analytics unifiées : Data Warehouse vs Data Lake vs lakehouse vs Data Mesh
- Les différents types d'apprentissage de modèles
- Les grands modèles de langage
- De GPT-1 à GPT-4
- Etudes de cas d'utilisation des grands modèles de langage et des modèles génératifs
- Avantages et limites
- Vue d'ensemble de l'offre IA sur le Cloud Azure
- Les différents services :
- D'Azure Cognitive Services
- D'Azure OpenAI
Concevoir une plateforme d'analytiques moderne
- Cycle de vie de la Data
- Gouvernance et sécurité
- Apports des offres Cloud
- Offres Cloud classiques (Azure, AWS, GCP) et offres multi-Cloud (Databricks, Snowflake, Fivetran, dbt)
- Moderniser les workflows Data
Exemples de travaux pratiques (à titre indicatif)
- Prise en main d'Azure Cognitives Services, création d'une application de reconnaissance d'images
- Prise en main d'Azure OpenAI, création d'une application à base de GPT-4
Jour 2
Développer la Data team
- Définir les besoins clés de l'organisation
- Les DADO (data-Analytics Driven Organizations)
- Les DEDO (data-Engineering Driven Organizations)
- Les DSDO (data-Science Driven Organizations)
Frameworks de migration
- La migration en quatre étapes :
- Prepare / discover
- Assess / plan
- Execute
- Optimize
- Estimation des coûts :
- Audit de l'existant
- Devis
- PoC
- MVP
- Mettre en place la sécurité et la gouvernance
- Schéma, pipeline, migration des données
Exemples de travaux pratiques (à titre indicatif)
- Etudes de cas de conception de plateformes d'analytics mettant en oeuvre les principes abordés
Architecture d'un Data Lake
- Spécificités d'un Data Lake
- Etapes d'un projet de Data Lake
- Data Lake On-Premise vs sur le Cloud : solutions technologiques et avantages / inconvénients
- Intégration du Data Lake au SI (Système d'Information)
- Zonage et gouvernance du Data Lake
- Le Data Lake en self-service
- Importance du catalogue de données
- Le Data Lake au service des Data Scientists
Exemples de travaux pratiques (à titre indicatif)
- Déploiement d'un Data Lake sur le Cloud et exécution d'analytics
Jour 3
Architecture d'un Data Warehouse
- Spécificités d'un Data Warehouse
- Variantes architecturales d'un Data Warehouse (ETL, intégrateurs, magasins de données...)
- Etapes d'un projet de Data Warehouse
- Data Warehouse On-Premise vs sur le Cloud : solutions technologiques et avantages / inconvénients
- Intégration du Data Warehouse au SI
- Gouvernance du Data Warehouse
- Le Data Warehouse au service des Data Scientists
Exemples de travaux pratiques (à titre indicatif)
- Déploiement d'un Data Warehouse sur le Cloud et exécution d'analytics
Architecture d'un lakehouse
- Spécificités d'un Data Lakehouse : le meilleur de deux mondes
- Variantes architecturales d'un lakehouse
- Etapes d'un projet de Data Lakehouse
- Offres de lakehouses sur le Cloud
- Intégration du lakehouse au SI
- Gouvernance du lakehouse
- Le lakehouse au service des Data Scientists
Exemples de travaux pratiques (à titre indicatif)
- Déploiement d'un lakehouse sur le Cloud et exécution d'analytics
Architectures de streaming
- L'intérêt du streaming
- Streaming ingest (ETL, ELT, Insert, IoT, Sink)
- Tableaux de bord en temps réel, live querying
- Analytics de traitement de flux de données
- Apprentissage d'un modèle sur des données en streaming
- Démonstration d'analytics sur un flux de données
Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.
Modalités d’évaluation des acquis
- En cours de formation, par des études de cas ou des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation

Proposé par
M2I
"Un leadership dans le domaine de la formation"