Modèles prédictifs, régressions linéaires, logistiques, Pls et Ancova
Prérequis
Il est indispensable que les participants aient :
- De bonnes connaissances sur les outils statistiques de base : statistiques descriptives, intervalles de confiance, p-value, risque alpha, tests d'hypothèses…
- Quelques connaissances sur la corrélation et la régression linéaire
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Définir le contexte et les objectifs des différentes méthodes
- Mettre en œuvre et interpréter les résultats des méthodes suivantes
- Régression linéaire multiple
- Modèle linéaire général (ANCOVA, MANOVA…)
- Régression PLS
- Régression logistique
- Vérifier les conditions de mise en œuvre des différentes méthodes
- Connaître les grandes lignes des concepts mathématiques inhérents à ces méthodes
- Identifier et prendre en compte les problèmes de multi colinéarités sur les modèles linéaires : sélection des variables, PLS…
- Mesurer la qualité d'ajustement et la qualité de prédiction (d'estimation des coefficients) du modèle
- Détecter et analyser les points aberrants / les points influents
Programme de la formation
Rappels sur les notions de corrélation
- Définition du coefficient de corrélation
- Interprétation de la valeur du coefficient de corrélation
- Les confusions : corrélation, causalité, pente…
- Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman
Modélisation de type régression linéaire simple
- Principes et concepts mathématiques inhérents à la régression linéaire simple
- Tests d'hypothèse de significativité du modèle
- Qualité du modèle,
- Coefficient de détermination R², R² ajusté, R² Prev
- Utilisation du modèle
- Prédiction de valeurs individuelles
- Intervalles de confiance des prédictions
- Traitement graphique des résultats
- Principes et concepts mathématiques inhérents à la régression linéaire multiple
- Inférence du modèle, inférence des variables (statistique de Fisher)
- Analyse des résidus
- Calculs des résidus
- Sens physique et statistique
- Homogénéité
- Distribution, Normalité
- Valeurs suspectes
- Analyses graphiques
- Valeurs suspectes et points influents
- Résidus : résidus studentisés
- Effet levier
- Distance de Cook
- Qualité du modèle
- Qualité d'ajustement, coefficient de détermination R², R² ajusté
- Qualité de prédiction, erreur d'estimation
- Utilisation du modèle
- Prédiction (prévision) de valeurs individuelles
- Intervalles de confiance des prédictions (prévisions)
- Illustration graphique des résultats
Le modèle de régression multiple
- Significativité des coefficients
- Hiérarchie des coefficients
- Problèmes liés à la multi-colinéarité
- Mesures des colinéarités
- Coefficient de corrélation
- Vifs
- Résolution des problèmes de multi-colinéarité
Analyse des problèmes de multi colinéarité à travers la sélection des variables
- Détection de la colinéarité
- Effets nocifs de la colinéarité entre variables explicatives
- Outils de détection : corrélation, VIF, cohérence des signes
- Les solutions proposées
- Expérimentation structurée
- Sélection de variables
- PLS
- Traitement de la colinéarité – Sélection de variables
- Sélection par optimisation. Critère du R², du R² ajusté, de l'AIC et du BIC
- Algorithmes de sélection « pas à pas » : Forward selection, Backward selection, Stepwise regression
Mise en œuvre et interprétation des résultats d'une régression PLS
- Contexte et objectifs
- Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
- Principes et concepts mathématiques inhérents à la PCR et la régression PLS
- Présentation des différentes versions de la régression PLS
- Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
- Choix du nombre de composantes (validation croisée)
- Composantes et coefficients de régression
- Qualité d'ajustement, qualité de prédiction
- Coefficients Q² et R²
- Importance des variables explicatives pour la prédiction
- Coefficients normalisés
- VIP
- Sélection de variables
Mise en œuvre et interprétation des résultats d'une ANCOVA (modèles linéaires généraux)
- Contexte et objectifs
- Notion d'interaction entre les variables explicatives qualitatives et quantitatives
- Modèle à droites confondues
- Modèle additif
- Modèle complet
- Mise en œuvre et interprétation des résultats des différents modèles
- Lecture et utilisation du modèle
- Tests de significativité des différents termes (F de Fisher)
- Epuration du modèle (sélection des termes et des variables influents)
- Conditions d'utilisation de l'ANCOVA
Modélisation de type régression logistique
- Contexte et objectifs
- Différences entre la régression linéaire et la régression logistique
- Définition du modèle Logit
- Mise en œuvre et interprétation des résultats
- Découpage en classes des variables explicatives quantitatives
- Estimation et interprétation des coefficients du modèle
- Tests d'apport d'une variable (test de Wald, tests sur les rapports de vraisemblance)
- Interprétation du Khi² de Wald
- Odds-ratios
- Parallèle odds ratios et risques relatifs
- Analyse du tableau de classement
- Taux de réussite, taux d'échec
- Vrais positifs, vrais négatifs, faux positifs, faux négatifs
- Probabilités ajustées et utilisation du modèle à des fins de prédiction
- Conditions d'utilisation

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"

Proposé par
GROUPE ARKESYS
