MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

Qualiopi

Cette formation a pour objectif de comprendre la mise en place d'un modèle prédictif basé sur l'utilisation des arbres de décisions et des forêts aléatoires.

À partir de 1550 €
Durée 14h en 2 jours
Localisation Partout en France
Logo de GROUPE ARKESYS - MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

Proposé par

GROUPE ARKESYS

Prérequis

  • Une connaissance des outils statistiques de base est souhaitée.
  • Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

 

Public admis

  • Salarié en Poste
  • Entreprise

Demandeur d'emploi et Etudiant non admis

Financement

  • Votre OPCO
  • Financement personnel

Financement CPF non pris en charge

Modalités

  • En centre
  • En entreprise
  • À distance

Objectifs pédagogiques

  • Maitriser le vocabulaire spécifique à la construction des arbres de décisions et des forêts aléatoires
  • Comprendre l'algorithme de construction des arbres de décisions
  • Connaitre les objectifs et les différences entre les méthodes d'apprentissage supervisé
  • Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction quantitative
  • Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction qualitative
  • Comprendre l'algorithme de construction des forêts aléatoires
  • Maitriser les paramètres permettant d'estimer la qualité de prédiction des arbres de décisions

Programme de la formation

Jour 1 – Matin

 

Explorer les différentes méthodes d'apprentissage supervisé

  • Champs d'application des différentes méthodes
  • Objectifs de l'apprentissage supervisé
  • Objectifs de description
  • Objectifs de prédiction
  • Structure des jeux de données
  • Présentation générale de l'éventail des méthodes
    • Arbre de décision
    • Forêts aléatoires

 

Jour 1 – Après-midi

 

Appliquer les méthodes d'arbre de décision

  • Structure du jeu de données
  • Principes, vocabulaire et objectifs
  • Notion d'échantillon d'apprentissage, de validation et de test
  • Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
  • Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
  • Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
  • Définition des groupes après construction de l'arbre
  • Indicateurs de qualité et de pureté
  • Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
  • Avantages et inconvénients : limites des arbres de décision
  • Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision

 

Jour 2 – Matin

 

Utiliser la méthode des forêts aléatoires (random forest)

  • Pourquoi avoir recourt aux forêts aléatoires ?
  • Principes et objectifs
    • Instabilité de l'arbre
    • Notion de Bagging
    • Les erreurs liées à l'échantillonnage (Out-Of-Bag)
  • Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
  • Evaluer l'importance des variables
    • Notion d'importance
    • Comportement de l'importance
    • Lien entre diversité des arbres et l'importance
    • Influence des paramètres
  • Sélection de variables
    • Généralités et principes de la sélection
    • Procédure de sélection
  • Les paramètres de sélection

 

Jour 2 – Après-midi

 

Optimiser le sous et surajustement

  • Notions de biais d'un modèle
  • Notions de variance d'un modèle
  • Optimalité variance & biais
  • Jugement de la qualité d'un modèle
  • Méthode du Data Train / Data test
  • Validation croisée
  • Classique LOO (Leave One Out)
  • Validation croisée par k fold

 

Réaliser des exercices pratiques

  • Applications avec R
  • Démonstration avec Excel

 

Cas d'études sur données des apprenants

 

Jeux de données 

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants. 

Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de : 

  • Se "reconnaitre" dans les thèmes abordés,  
  • Mieux percevoir l'intérêt des notions étudiées  
  • S'approprier le contenu de la formation 

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation. 

 

Outil logiciel 

Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.

Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Logo de GROUPE ARKESYS - Formation MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

Proposé par

GROUPE ARKESYS

"La formation maintenant pour vos talents de demain"

Voir la fiche entreprise
À partir de 1550 €
Logo de GROUPE ARKESYS - MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

0 ville proposant cette formation
Logo

La 1ère plateforme pour trouver une formation, choisir son orientation ou construire son projet de reconversion.

© 2024 France Carrière. Tous droits réservés.