Formation - Les bases de l'apprentissage Machine (Machine Learning)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 3 jours (21 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche

Tarif

Contacter l'organisme

Durée 3 jours (21 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Programme

1 - L'apprentissage machine (Introduction)

  • Introduction
  • Champs de compétences
  • Focus Data Science (Data Mining)
  • Focus Machine Learning
  • Focus Big Data
  • Focus Deep Learning
  • Définition de l'apprentissage machine
  • Exemples de tâches du machine Learning
  • Que peuvent apprendre les machines
  • Les différents modes d'entraînement

2 - Les fondamentaux de l'apprentissage machine

  • Préambule : - Un problème d'optimisation - Quête de la capacité optimale du modèle - Relation capacité et erreurs - Un apport philosophique - Cadre statistique - Anatomie d'un modèle d'apprentissage machine
  • Jeux de données d'entraînement : - Cadre statistique - Les variables prédictives - Chaîne de traitement des variables prédictives - Les variables à prédire
  • Fonctions hypothèses : - Principe : jeux de fonctions hypothèses - Contexte de sélection des fonctions hypothèses - Caractéristiques des fonctions hypothèses - Modèles probabilistes Fréquentistes et Bayésiens
  • Fonctions de coûts : - Les estimateurs - Principe du maximum de vraisemblance (MLE*) - MAP - Maximum A Posteriori - Le biais d'un estimateur - La variance d'un estimateur - Le compromis biais - variance - Les fonctions de coûts - La régularisation des paramètres
  • Algorithmes d'optimisations : - Les grandes classes d'algorithmes d'optimisation - La descente de gradient (1er ordre) - Descente de gradient (détails) - Les approches de Newton (2nd ordre) - Optimisation batch et stochastique - Pour aller plus loin
  • Lab : Mise en oeuvre de l'environnement de travail machine Learning

3 - La classification

  • Introduction : - Choisir un algorithme de classification
  • La régression logistique : - Du Perceptron à la régression logistique - Hypothèses du modèle - Apprentissage des poids du modèle - Exemple d'implémentation : scikit-learn - Régression logistique - Fiche Synthèse
  • SVM : - Classification à marge maximum - La notion de marge souple (soft margin) - Les machines à noyau (kernel machines) - L'astuce du noyau (kernel trick) - Les fonctions noyaux - SVM - Maths - SVM - Fiche Synthèse
  • Arbres de décision : - Principe de base - Fonctionnement - Maximisation du Gain Informationnel - Mesure d'impureté d'un noeud - Exemple d'implémentation : scikit-learn -Arbres de décision - Fiche Synthèse
  • K plus proches voisins (kNN) : - L'apprentissage à base d'exemples - Principe de fonctionnement - Avantages et désavantages - kNN - Fiche synthèse
  • Synthèse
  • Lab : Expérimentation des algorithmes de classification sur cas concrets

4 - Les pratiques

  • Prétraitement : - Gestion des données manquantes - Transformateurs et estimateurs - Le traitement des données catégorielles - Le partitionnement des jeux de données - Mise à l'échelle des données
  • Ingénierie des variables prédictives (Feature Engineering) : - Sélection des variables prédictives - Sélection induite par régularisation L1 - Sélection séquentielle des variables - Déterminer l'importance des variables - Réduction dimensionnelle par Compression des données - L'extraction de variables prédictives - Analyse en composante principale (ACP) - Analyse linéaire discriminante (ADL) - l'ACP à noyau (KPCA)
  • Réglages des hyper-paramètres et évaluation des modèles : - Bonnes pratiques - La notion de Pipeline - La validation croisée (cross validation) - Courbes d'apprentissage - Courbes de validation - La recherche par grille (grid search) - Validation croisée imbriquée (grid searchcv) - Métriques de performance
  • Synthèse
  • Lab : Expérimentation des pratiques du machine learning sur cas concrets

5 - L'apprentissage d'ensembles (ensemble learning)

  • Introduction
  • L'approche par vote
  • Une variante : l'empilement (stacking)
  • Le bagging
  • Les forêts aléatoires
  • Le boosting
  • La variante Adaboost
  • Gradient Boosting
  • Fiches synthèses
  • Lab : L'apprentissage d'ensemble sur un cas concret

6 - La régression

  • Régression linéaire simple
  • Régression linéaire multi-variée
  • Relations entre les variables
  • Valeurs aberrantes (RANSAC)
  • Évaluation de la performance des modèles de régression
  • La régularisation des modèles de régression linéaire
  • Régression polynomiale
  • La régression avec les forêts aléatoires
  • Synthèse
  • Lab : La régression sur un cas concret

7 - Le clustering

  • Introduction
  • Le regroupement d'objets par similarité avec les k-moyens (k-means)
  • k-means : algorithme
  • L'inertie d'un cluster
  • Variante k-means ++
  • Le clustering flou
  • Trouver le nombre optimal de clusters avec la méthode Elbow
  • Appréhender la qualité des clusters avec la méthode des silhouettes
  • Le clustering hiérarchique
  • Le clustering par mesure de densité DBSCAN
  • Autres approches du Clustering
  • Synthèse
  • Lab : Le clustering sur un cas concret

Prérequis

Public

  • Ingénieurs, analystes, responsables marketing
  • Data Analysts, Data Scientists, Data Steward
  • Toute personne intéressée par les techniques de Data Mining et de Machine Learning

Ces formations pourraient vous intéresser

Objectifs de la formation

Les objectifs de la formation Modifier une machine ou un ensemble de machines en service :

- Modifier une machine en intégrant les règles de sécurité applicables - Mettre en œuvre le guide du ministère du Travail pour la modification des machines

Tarif

A partir de 984,00 €

Durée

2j / 14h

Modes

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Développer des modèles de données en suivant les bonnes pratiques SAP pour un maximum de performance et de flexibilité
  • Démarrer avec la modélisation basée sur les langages SQL et SQLScript
  • Gérer des projets et du contenu dans le Web IDE for SAP HANA
  • Mettre en oeuvre la sécurité et le contrôle d'accès aux données autour des modèles de données SAP HANA.
Tarif

A partir de 4 100,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Evaluer si la méthode Agile convient à un client, en fonction des spécificités du client et du projet
  • Travailler dans un projet Agile et assumer les responsabilités de son (ses) rôle(s) Agile(s)
  • Contribuer à un projet Agile de mise en oeuvre de solutions SAP avec SAP Activate
  • Utiliser les accélérateurs SAP Activate qui aident à mettre en oeuvre avec succès les solutions SAP de manière Agile.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les différentes facettes de la responsabilité dans l'IA
  • Décrire le contexte réglementaire en Union Européenne
  • Evaluer les risques réglementaires et de réputation liés à vos projets IA
  • Gérer les notions d'incertitude et d'explicabilité pour préserver la confidentialité, l'équité et la confiance.
Tarif

A partir de 850,00 €

Durée

1j / 7h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Maitriser le vocabulaire spécifique à la construction des arbres de décisions et des forêts aléatoires
  • Comprendre l'algorithme de construction des arbres de décisions
  • Connaitre les objectifs et les différences entre les méthodes d'apprentissage supervisé
  • Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction quantitative
  • Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction qualitative
  • Comprendre l'algorithme de construction des forêts aléatoires
  • Maitriser les paramètres permettant d'estimer la qualité de prédiction des arbres de décisions
Tarif

A partir de 1 550,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • D'identifier le contexte général d'utilisation de la régression logistique
  • De connaître les concepts mathématiques inhérents à la régression logistique
  • De mettre en œuvre et analyser les résultats (tableaux, graphiques) d'une modélisation de type régression logistique
  • De calculer les probabilités ajustées d'apparition d'un évènement « succès » 
  • De comparer la régression logistique avec d'autres outils type Afd, Méthode de classement
  • D'interpréter les coefficients tels que les odds-ratios, notamment dans un contexte épidémiologique 
  • D'identifier et de résoudre les problèmes rencontrés lors de la mise en œuvre d'un modèle de type régression logistique 
  • De détecter et traiter les colinéarités éventuelles entre variables explicatives
Tarif

A partir de 1 550,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre le fonctionnement des agents conversationnels et de ChatGPT.
  • Maîtriser les bases de l'apprentissage automatique et du traitement du langage naturel.
  • Collecter, préparer, et utiliser les données d'entraînement pour un modèle conversationnel.
  • Entraîner, évaluer, et améliorer un modèle conversationnel.
  • Adapter le modèle à un domaine spécifique et gérer des tâches complexes.
  • Maîtriser le déploiement, la surveillance et l'amélioration continue d'un agent conversationnel.
Tarif

A partir de 2 990,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre la démarche de l'algorithme Svm
  • Comprendre les avantages et les inconvénients du knn
  • Comprendre les principes mathématiques sous-jacents au SVM
  • Comprendre la notion de noyau
  • Choisir un noyau approprié à une problématique
  • Trouver les réglages optimaux des hyper paramètres des noyaux
  • Valider le modèle en appliquant les différentes méthodes de validation
  • Mettre en œuvre sous des logiciels comme R l'algorithme Svm
Tarif

A partir de 1 550,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Maîtriser le langage PYTHON

Proposé par SHURAFORM - FORMAEREM

Objectifs de la formation

1- Acquérir une compréhension fondamentale de la syntaxe et de la structure de Python.

2-Apprendre à utiliser les variables, les types de données et les opérateurs Python pour manipuler des informations.

3-Comprendre les structures de controle telles que les boucles et les instructions conditionnelles pour créer des programmes efficaces.

4- Explorer les fonctions et les modules Python pour organiser et réutiliser le code

5- Apprendre à manipuler des listes, des tuples, des dictionnaires et d'autres structures de données intégrées.

5- Comprendre les concepts de programmation fonctionnelle en Python

6- Se préparer à poursuivre l'apprentissage autonome pour continuer à améliorer ses compétences en Python
Tarif

A partir de 585,00 €

Durée

2j / 15h

Modes
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire la palette des métiers de la Data et leurs spécificités
  • Dimensionner et structurer une équipe de talents de la Data
  • Utiliser les clés pour optimiser l'efficacité de ces talents dans l'entreprise.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Je cherche à faire...