Méthodes d’apprentissage supervisé : Arbres de décision et forêts aléatoires
Prérequis
- IL EST INDISPENSABLE que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.
- Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Maîtriser le vocabulaire spécifique aux méthodes d'apprentissage supervisé
- Identifier le contexte et les conditions d'application des méthodes d'apprentissage supervisé
- Connaître les objectifs et les différences entre les méthodes d'apprentissage supervisé
- Décrire la méthodologie inhérente à ces méthodes
- Mettre en œuvre et interpréter les résultats des méthodes d'apprentissage supervisé
- Connaître les principaux indicateurs de cohérence liés aux méthodes d'apprentissage supervisé
- Connaître les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision et de forêt aléatoire
- Maitriser les paramètres permettant d'estimer la qualité de ces analyses
Programme de la formation
Généralités sur les différentes méthodes d'apprentissage supervisé
- Champs d'application des différentes méthodes
- Objectifs de l'apprentissage supervisé
- Objectifs de description
- Objectifs de prédiction
- Structure des jeux de données
- Présentation générale de l'éventail des méthodes
- Arbre de décision
- Forêt aléatoire
Contexte d'application des méthodes d'arbre de décision
- Structure du jeu de données
- Principes, vocabulaire et objectifs
- Notion d'échantillon d'apprentissage, de validation et de test
- Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
- Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
- Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
- Définition des groupes après construction de l'arbre
- Indicateurs de qualité
- Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
- Avantages et inconvénients : limites des arbres de décision
- Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision
Contexte d'application des méthodes de forêt aléatoire
- Pourquoi avoir recourt aux forêts aléatoires ?
- Principes et objectifs
- Instabilité de l'arbre
- Notion de Bagging
- Les erreurs liées à l'échantillonnage (Out-Of-Bag)
- Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
- Evaluer l'importance des variables
- Notion d'importance
- Comportement de l'importance
- Lien entre diversité des arbres et l'importance
- Influence des paramètres
- Sélection de variables
- Généralités et principes de la sélection
- Procédure de sélection
- Les paramètres de sélection
Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"
Proposé par
GROUPE ARKESYS