Big Data - Développement d'applications de Machine Learning et d'Intelligence Artificielle (IA)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Développer des applications de Machine Learning et d'IA (Intelligence Artificielle) avec Spark et Python
  • Utiliser la programmation parallèle sur un cluster
  • Développer et optimiser des algorithmes standards de Machine Learning et d'IA
  • Utiliser les bibliothèques Python pour le Machine Learning et d'IA
  • Décrire le cycle de vie d'un projet Data Science.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 3 800,00 €

Durée 5 jours  (35h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Vue d'ensemble du Big Data, du Machine Learning et de l'IA

  • Introduction au Big Data et à l'IA (Intelligence Artificielle) : de quoi s'agit-il ?
  • Perspectives offertes par le Big Data et l'IA
  • Les acteurs du Big Data et de l'IA
  • Exemples pratiques
  • Les technologies concernées
  • Les différents métiers
  • Aspects économiques (OPEX, CAPEX, TRI) du Cloud vs On-Premise
  • Démonstration d'applications

Rappels sur la Data Science

  • Les bases du langage Python
  • Modélisation des problématiques grâce à des vecteurs et matrices
  • Probabilités, statistiques, statistiques descriptives, statistiques explicatives
  • Entropie, gain d'information
  • Compromis biais-complexité
  • La malédiction de la dimension
  • Matrice de confusion
  • Gérer les valeurs manquantes MCAR / MAR / MNAR
  • Validation croisée
  • Courbe d'apprentissage
  • Fondamentaux du nettoyage des données
  • Réduction de la dimension par sélection de variables et par transformation de variables
  • Métriques de performance d'un modèle :
    • Accuracy
    • Prrécision et rappel (recall)
    • F1-score
    • AUC
    • P-valeur

Exemples de travaux pratiques (à titre indicatif)

  • Chargement, exploration, analyse, nettoyage, et premières modélisations sur un jeu de données

Jour 2

Machine Learning et IA : algorithmes

  • Les concepts du Machine Learning et de l'IA
  • Les données supervisées ou non supervisées : quelles différences ?
  • Les librairies :
    • Scikit-learn
    • Tensorflow
    • PyTorch
    • Keras
  • Régression
  • Modèles linéaires
  • Classification
  • Naive Bayes
  • K-NN
  • K-Means clustering

Exemples de travaux pratiques (à titre indicatif)

  • Mise en oeuvre des algorithmes vus en fonction de la finalité recherchée (régression, classification, imputation de valeurs manquantes) et en utilisant les librairies Scikit-learn et Keras

Jour 3

Machine Learning et IA : algorithmes (suite)

  • DBScan
  • Arbres de décision et de régression
  • Support Vector Machines (SVM)
  • Réseaux de neurones et apprentissage profond (Deep Learning)
  • Réseaux convolutifs, réseaux récurrents

Exemples de travaux pratiques (à titre indicatif)

  • Modélisations avancées (DL, CNN, RNN) avec optimisation des architectures et hyper-paramètres

Jour 4

Développer avec Spark

  • Introduction à Apache Spark
  • Faire du Machine Learning avec Apache Spark MLlib
  • Traiter les données en temps réel avec Apache Spark Streaming
  • Faire des requêtes au format SQL avec Apache Spark SQL
  • Modélisation de réseaux sociaux grâce à des graphes avec Apache Spark GraphFrames
  • Démonstration du travail collaboratif avec MLFlow

Exemples de travaux pratiques (à titre indicatif)

  • Exercices d'application avec Spark MLlib/Streaming/SQL/GraphFrames
  • Mise en oeuvre de MLFlow pour comparer les modèles

Jour 5

Outil de visualisation des données (ou Dataviz)

  • Définition de la Dataviz
  • Les acteurs de la Dataviz
  • Principes de la Dataviz
  • Exemples d'analyse (sous forme de démo) :
    • Bibliothèques de Dataviz de Python
    • Tableau Desktop / Public
    • Microsoft Power BI

Introduction à MLOps et aux architectures serverless

  • Les approches DevOps et GitOps
  • Bases de la conteneurisation et de l'automatisation
  • Les architectures serverless
  • Développer et déployer des applications MLOps en production (démo)
  • Monitoring et amélioration continue des applications MLOps (démo)

Exemples de travaux pratiques (à titre indicatif)

  • Prise en main de Tableau ou MS Power BI
  • Utilisation de librairies Python (Matplotlib, Seaborn)
  • Création et exécution d'un pipeline MLOps avec serving et monitoring du modèle

Examen M2i (en option)

  • Prévoir l'achat de l'examen en supplément
  • L'examen (en français) sera passé le dernier jour, à l'issue de la formation et s'effectuera en ligne
  • Il s'agit d'un QCM dont la durée moyenne est d'1h30 et dont le score obtenu attestera d'un niveau de compétence
  • L'examen n'est pas éligible au CPF, mais permettra néanmoins de valider vos acquis

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation et/ou un examen M2i

Les + de la formation

Un examen M2i permettant de valider vos acquis à l'issue de la formation est disponible sur demande (coût : 120€).

Prérequis

Avoir des connaissances en mathématiques algébriques pour pouvoir interpréter les algorithmes à mettre en oeuvre, et connaître le langage Python (des rappels seront faits pendant la formation).

Public

Toute personne souhaitant acquérir des compétences dans le développement d'applications de Machine Learning et d'IA (Intelligence Artificielle).

Ces formations pourraient vous intéresser

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser les nouvelles fonctionnalités de l'architecture multi-tenant
  • Identifier les nouvelles fonctionnalités de la sécurité des base de données et de RMAN
  • Distinguer les nouvelles fonctionnalités du Data Warehousing et les améliorations apportées au Sharding.
Tarif

A partir de 1 220,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

4 jours (28 heures)

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre le fonctionnement sous-jacent de DALL-E et des modèles similaires
  • Appréhender les principales utilisations et applications de DALL-E
  • Utiliser les différentes fonctionnalités de DALL-E
  • Identifier les enjeux éthiques, les limites et les considérations de sécurité liés à l'utilisation de DALL-E
Tarif

A partir de 1 390,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous aurez acquis les connaissances nécessaires pour :

  • Connaitre les éléments essentiels d’une salle informatique ou d’un datacenter.
  • Définir l’urbanisation des racks et des confinements d’air chaud et froid.
  • Connaitre et comprendre les 6 normes Europe/ISO permettant de calculer les 6 ratios énergétiques des datacenters (Electricité, Eau, Carbone, etc.).
  • Savoir choisir les bonnes technologies de refroidissement (et leurs usages mixtes).
  • Comprendre comment utiliser l’IOT, le Big Data et l’IA pour mesurer, contrôler et maintenir préventivement les environnements énergétiques des datacenters.
Tarif

A partir de 1 480,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise

Formation Kedro

Proposé par Sparks

Objectifs de la formation

  • Comprendre les principes de développement utiles aux ingénieurs data et data scientists pour faciliter le déploiement de leur code en production
  • S’approprier les principales fonctionnalités de Kedro (project template, configuration, data catalog et pipeline)
  • Mettre en œuvre l’outil dans un workflow pour créer des pipelines de données
Tarif

A partir de 750,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Enumérer les cas d'usage de vRealize Operations
  • Décrire les caractéristiques et avantages de vRealize Operations
  • Déterminer le cluster vRealize Operations qui répond à vos besoins de surveillance
  • Déployer et configurer un cluster vRealize Operations
  • Utiliser les fonctionnalités de l'interface pour évaluer et résoudre les problèmes opérationnels
  • Décrire les certificats vRealize Operations
  • Créer des politiques pour répondre aux besoins opérationnels de votre environnement
  • Reconnaître les moyens efficaces d'optimiser les performances, la capacité et les coûts dans les Data Centers
  • Dépanner et gérer les problèmes à l'aide de Workbench, des alertes et des tableaux de bord prédéfinis
  • Gérer les configurations
  • Configurer la surveillance des applications en utilisant VMware vRealize Application Remote Collector
  • Créer des définitions de symptômes et d'alertes, des rapports et des vues personnalisés
  • Créer divers tableaux de bord personnalisés à l'aide du canevas
  • Configurer des widgets et leurs interactions pour les tableaux de bord
  • Créer des "Super Mesures"
  • Configurer des utilisateurs et des groupes d'utilisateurs pour contrôler l'accès à votre environnement
  • Etendre les capacités de vRealize Operations en ajoutant des packs de gestion et en configurant des solutions
  • Surveiller l'état du cluster vRealize Operations à l'aide de tableaux de bord d'autosurveillance.
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

Le cours est délivré dans les conditions définies par Microsoft : en partenariat avec un centre de formation agréé Microsoft Learning, formateur certifié Microsoft, lab officiel Microsoft, support de cours officiel Microsoft.

Cette formation officielle Microsoft Azure - Concevoir et mettre en œuvre une solution de Data Science vous permet d’acquérir les connaissances nécessaires pour utiliser les services Azure afin de développer, préparer et déployer des solutions de Machine Learning.

La formation commence par une présentation des services d’Azure supportant la Data Science. Elle se concentre ensuite sur le service Data Science d’Azure - le service de Machine Learning service - pour automatiser le pipeline.

Elle ne fournit pas les connaissances nécessaires pour réaliser de la data science, et suppose que les apprenants ont déjà ces connaissances.

Tarif

A partir de 2 090,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les applications de l'Intelligence Artificielle dans la fonction RH et exploiter les data.
  • S’approprier les outils et les applications possibles dans la fonction RH : recrutement, développement, formation et qualité de vie au travail
  • Sélectionner les tâches automatisables dans la gestion des RH.
  • Se préparer à l’évolution des compétences RH liées à l’Intelligence Artificielle.
  • Garantir une utilisation éthique de l’IA en RH.
Tarif

A partir de 1 495,00 €

Durée

2 jours (14 heures)

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre et différencier les concepts présentés : Big Data, Data Science, Machine Learning, etc
  • Comprendre les apports et enjeux des concepts évoqués
  • Connaître les types de solutions techniques et méthodologiques possibles pour une application de ces concepts en entreprise
  • Appréhender la mise en œuvre d'un projet Data Science
Tarif

A partir de 650,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...