MACHINE LEARNING Modèle prédictif avec l'algorithme SVM
Cette formation a pour objectif de comprendre la mise en place d'un modèle prédictif basé sur du Machine Learning à partir de l'algorithme dit Support Vecteur Machine ou Séparateurs à Vastes Marges (SVM).
Prérequis
- Une connaissance des outils statistiques de base est souhaitée
- Une connaissance des approches prédictives classiques (régression) est un plus mais pas strictement nécessaire.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Comprendre la démarche de l'algorithme Svm
- Comprendre les avantages et les inconvénients du knn
- Comprendre les principes mathématiques sous-jacents au SVM
- Comprendre la notion de noyau
- Choisir un noyau approprié à une problématique
- Trouver les réglages optimaux des hyper paramètres des noyaux
- Valider le modèle en appliquant les différentes méthodes de validation
- Mettre en œuvre sous des logiciels comme R l'algorithme Svm
Programme de la formation
Jour 1 – Matin
Rappeler la démarche de la modélisation
- Que veut-on prédire
- Variable Qualitative
- Variable Quantitative
- Quantification de l'erreur du modèle
- Modèles à Y Quantitatif
- Modèles à Y Qualitatif
Jour 1 – Après-midi
Comprendre le fonctionnement du Svm
- Préparation des données
- Problèmes d'échelle sur les X
- Centrage des valeurs de X
- La démarche du Svm
- Notions de marges
- Cas d'une prédiction qualitative
Explorer le noyau d'un Svm
- Séparateur linéaire et non linéaire
- L'astuce du noyau
- Fonctionnement mathématique d'un noyau
- Noyau et paramètres associés
- Recherche de l'optimalité des paramètres des noyaux
Jour 2 – Matin
Mettre en application du Svm sur des variables X qualitatives
- Comment transformer des X qualitatives en X quantitatives
- Méthodes de l'Analyse factorielles de Correspondances
- Récupération des coordonnées des individus
- Mise en place du KnSvmn
Jour 2 – Après-midi
Optimiser le sous et surajustement
- Notions de biais d'un modèle
- Notions de variance d'un modèle
- Optimalité variance & biais
- Jugement de la qualité d'un modèle
- Matrice de confusion
- Méthode du Data Train / Data test
- Validation croisée
- Classique LOO (leave One Out)
- Validation croisée par k fold
Réaliser des exercices pratiques
- Applications avec R
- Démonstration avec Excel
- Cas d'études sur données des apprenants
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.
Outil logiciel
Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"

Proposé par
GROUPE ARKESYS
