MACHINE LEARNING Modèle prédictif avec la régression logistique
Prérequis
- Une connaissance des outils statistiques de base est souhaitée
- Une connaissance des approches prédictives classiques (régression) est un plus mais pas strictement nécessaire.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- D'identifier le contexte général d'utilisation de la régression logistique
- De connaître les concepts mathématiques inhérents à la régression logistique
- De mettre en œuvre et analyser les résultats (tableaux, graphiques) d'une modélisation de type régression logistique
- De calculer les probabilités ajustées d'apparition d'un évènement « succès »
- De comparer la régression logistique avec d'autres outils type Afd, Méthode de classement
- D'interpréter les coefficients tels que les odds-ratios, notamment dans un contexte épidémiologique
- D'identifier et de résoudre les problèmes rencontrés lors de la mise en œuvre d'un modèle de type régression logistique
- De détecter et traiter les colinéarités éventuelles entre variables explicatives
Programme de la formation
Jour 1 – Matin
Utiliser le modèle de régression logistique
- Variable explicative et variable expliquée (continue / binaire)
- Différences entre la régression linéaire classique et la régression logistique
- Variables explicatives qualitatives, variables explicatives quantitatives
- Objectifs de la régression logistique
- Définition du modèle Logit (courbe sigmoïde)
- Découpage en classes des variables explicatives quantitatives
- Conditions d'utilisation à respecter
Maîtriser les fondements mathématiques
- Le modèle linéaire généralisé
- Le maximum de vraisemblance
- Recherche des coefficients du prédicteur linéaire
- Transformation des coefficients
Jour 1 – Après-midi
Mettre en œuvre et analyser des résultats d'un modèle de régression logistique
- Estimation et interprétation des coefficients du modèle
- Test de significativité du modèle (validation du modèle)
- Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
- Interprétation du Khi² de Wald
- Odds-ratios
- Parallèle odds ratios et risques relatifs
- Analyse du tableau de classement
- Taux de réussite, taux d'échec
- Vrais positifs, vrais négatifs, faux positifs, faux négatifs
- Probabilités ajustées et utilisation du modèle à des fins de prédiction
- Mise en œuvre et interprétation des résultats (tableaux, graphiques) de la régression logistique
- Sur un tableau de contingence
- Sur un tableau composé de variables explicatives uniquement qualitatives, uniquement quantitatives, qualitatives et quantitatives
- Modèle de régression logistique multinomial
- Mise en œuvre et analyse des résultats d'un modèle de régression logistique multiple
- Estimation et interprétation des coefficients du modèle multiple
Jour 2 – Matin
Mesurer la qualité d'un modèle de régression logistique
- Qualité d'ajustement du modèle (coefficients R²)
- Qualité d'estimation des coefficients du modèle, qualité de prédiction
- Intervalles de confiance des coefficients du modèle
- Intervalles de confiance des odds-ratio
- Lien entre la qualité du modèle et :
- Les effectifs des classes
- La colinéarité des variables explicatives
- Sélection du modèle final
- Matrice de confusions
Analyser les variantes de la régression logistique
- La régression logistique multimodale
- La régression logistique ordinale
Jour 2 – Après-midi
Comprendre le sous et surajustement
- Notions de biais d'un modèle
- Notions de variance d'un modèle
- Optimalité variance & biais
- Jugement de la qualité d'un modèle
- Méthode du Data Train / Data test
- Validation croisée
- Classique LOO (leave One Out)
- Validation croisée par k fold
Réaliser des exercices pratiques
- Applications avec R
- Démonstration avec Excel
Cas d'études sur données des apprenants
Jeux de données
Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.
Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :
- Se "reconnaitre" dans les thèmes abordés,
- Mieux percevoir l'intérêt des notions étudiées
- S'approprier le contenu de la formation
Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.
Outil logiciel
Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"

Proposé par
GROUPE ARKESYS
