Prérequis
- Il est souhaitable que les participants aient de bonnes connaissances sur les outils statistiques de bases : statistiques descriptives, intervalles de confiance, p-value, risque alpha tests d'hypothèses, corrélation…
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Expliquer le contexte général d'utilisation de la régression linéaire
- Expliquer les concepts mathématiques inhérents à la régression linéaire
- Mettre en œuvre et analyser les résultats d'une régression linéaire
- Déterminer les coefficients permettant d'estimer la qualité du modèle
- Expliquer la différence entre la qualité d'ajustement et la qualité d'estimation des coefficients (de prévision)
- Détecter et analyser les points aberrants / les points influents
- Comprendre la problématique des colinéarités
- Détecter les multi colinéarités éventuelles entre variables explicatives
- Traiter la multi colinéarité par l'intermédiaire d'une sélection des variables explicatives
Programme de la formation
Outils statistiques de base nécessaires (révisions)
- Les conventions d'écriture sur les échantillons (, s, …) et les populations (µ, s, …)
- Les intervalles de confiance
- Les tests d'hypothèses
- La p-value
Rappels sur les notions de corrélation
- Définition du coefficient de corrélation
- Interprétation de la valeur du coefficient de corrélation
- Les confusions : corrélation, causalité, pente…
- Les différents coefficients de corrélation
- Coefficient de Pearson
- Coefficient de Spearman
Modélisation de type régression linéaire simple
- Principes et concepts mathématiques inhérents à la régression linéaire simple
- Tests d'hypothèse de significativité du modèle
- Qualité du modèle,
- Coefficient de détermination R², R² ajusté, R² Prev
- Utilisation du modèle
- Prédiction de valeurs individuelles
- Intervalles de confiance des prédictions
- Traitement graphique des résultats
- Principes et concepts mathématiques inhérents à la régression linéaire multiple
- Inférence du modèle, inférence des variables (statistique de Fisher)
- Analyse des résidus
- Calculs des résidus
- Sens physique et statistique
- Homogénéité
- Distribution, Normalité
- Valeurs suspectes
- Analyses graphiques
- Valeurs suspectes et points influents
- Résidus : résidus studentisés
- Effet levier
- Distance de Cook
- Qualité du modèle
- Qualité d'ajustement, coefficient de détermination R², R² ajusté
- Qualité de prédiction, erreur d'estimation
- Utilisation du modèle
- Prédiction (prévision) de valeurs individuelles
- Intervalles de confiance des prédictions (prévisions)
- Illustration graphique des résultats
Le modèle de régression multiple
- Significativité des coefficients
- Hiérarchie des coefficients
- Problèmes liés à la multi-colinéarité
- Mesures des colinéarités
- Coefficient de corrélation
- Vifs
- Résolution des problèmes de multi-colinéarité
Analyse des problèmes de multi colinéarité à travers la sélection des variables
- Détection de la colinéarité
- Effets nocifs de la colinéarité entre variables explicatives
- Outils de détection : corrélation, VIF, cohérence des signes
- Traitement de la colinéarité – Sélection de variables
- Sélection par optimisation. Critère du R², du R² ajusté, de l'AIC et du BIC
- Algorithmes de sélection « pas à pas » : Forward selection, Backward selection, Stepwise regression
- Prédiction de valeurs individuelles
- Intervalles de confiance des prédictions
- Traitement graphique des résultats

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"

Proposé par
GROUPE ARKESYS
