MACHINE LEARNING Modèle prédictif avec l'algorithme KNN
Cette formation a pour objectif de comprendre la mise en place d'un modèle prédictif basé sur du Machine Learning à partir de l'algorithme dit des k plus proches voisins (Knn).
Prérequis
- Une connaissance des outils statistiques de base est souhaitée
- Une connaissance des approches prédictives classiques (régression) est un plus mais pas strictement nécessaire.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Comprendre la démarche de l'algorithme knn
- Comprendre les avantages et les inconvénients du knn
- Trouver l'optimalité du paramètre k
- Valider le modèle en appliquant les différentes méthodes de validation
- Mettre en œuvre sous des logiciels comme R l'algorithme Knn
Programme de la formation
Jour 1 – Matin
Rappeler la démarche de la modélisation
- Que veut-on prédire
- Variable Qualitative
- Variable Quantitative
- Quantification de l'erreur du modèle
- Modèles à Y Quantitatif
- Modèles à Y Qualitatif
Maîtriser le fonctionnement du knn
- Préparation des données
- Problèmes d'échelle sur les X
- Centrage des valeurs de X
- La démarche du knn
- Cas d'une prédiction qualitative
- Cas d'une prédiction quantitative
Appliquer le Knn sur des variables X qualitatives
- Comment transformer des X qualitatives en X quantitatives
- Méthodes de l'Analyse factorielles de Correspondances
- Récupération des coordonnées des individus
- Mise en place du Knn
Jour 1 – Après-midi
Comprendre le sous et surajustement
- Notions de biais d'un modèle
- Notions de variance d'un modèle
- Optimalité variance & biais
- Jugement de la qualité d'un modèle
- Matrice de confusion
- Méthode du Data Train / Data test
- Validation croisée
- Classique LOO (Leave One Out)
- Validation croisée par k fold
Réaliser des exercices pratiques
- Applications avec R
- Démonstration avec Excel
- Cas d'études sur données des apprenants
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.
Outil logiciel
Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"