MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

Qualiopi

Cette formation a pour objectif de comprendre la mise en place d'un modèle prédictif basé sur l'utilisation des arbres de décisions et des forêts aléatoires.

À partir de 1550 €

Durée 14h en 2 jours

Localisation Partout en France

Proposé par

GROUPE ARKESYS

Prérequis

Une connaissance des outils statistiques de base est souhaitée.
Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Public admis

Salarié en Poste
Entreprise

Demandeur d'emploi et Etudiant non admis

Financement

Votre OPCO
Financement personnel

Financement CPF non pris en charge

Modalités

En centre
En entreprise
À distance

Objectifs pédagogiques

Maitriser le vocabulaire spécifique à la construction des arbres de décisions et des forêts aléatoires
Comprendre l'algorithme de construction des arbres de décisions
Connaitre les objectifs et les différences entre les méthodes d'apprentissage supervisé
Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction quantitative
Connaitre les paramètres à ajuster lors de la mise en œuvre des méthodes d'arbre de décision pour une prédiction qualitative
Comprendre l'algorithme de construction des forêts aléatoires
Maitriser les paramètres permettant d'estimer la qualité de prédiction des arbres de décisions

Programme de la formation

Jour 1 – Matin

Explorer les différentes méthodes d'apprentissage supervisé

Champs d'application des différentes méthodes
Objectifs de l'apprentissage supervisé
Objectifs de description
Objectifs de prédiction
Structure des jeux de données
Présentation générale de l'éventail des méthodes
- Arbre de décision
- Forêts aléatoires

Jour 1 – Après-midi

Appliquer les méthodes d'arbre de décision

Structure du jeu de données
Principes, vocabulaire et objectifs
Notion d'échantillon d'apprentissage, de validation et de test
Comparaison de méthodes de type régression linéaire / logistique aux arbres de décision
Principe de la segmentation selon le type de variable : Arbre de régression ou arbre de classification
Définir les conditions d'arrêt de construction d'un arbre : Notion de pré-élagage
Définition des groupes après construction de l'arbre
Indicateurs de qualité et de pureté
Comparaison d'arbre de décision selon un certain type d'algorithme : CHAID vs CART
Avantages et inconvénients : limites des arbres de décision
Mise en œuvre et interprétation des résultats obtenus après application d'une analyse par arbre de décision

Jour 2 – Matin

Utiliser la méthode des forêts aléatoires (random forest)

Pourquoi avoir recourt aux forêts aléatoires ?
Principes et objectifs
- Instabilité de l'arbre
- Notion de Bagging
- Les erreurs liées à l'échantillonnage (Out-Of-Bag)
Prédiction avec un algorithme de Forêt aléatoire : Les paramètres
Evaluer l'importance des variables
- Notion d'importance
- Comportement de l'importance
- Lien entre diversité des arbres et l'importance
- Influence des paramètres
Sélection de variables
- Généralités et principes de la sélection
- Procédure de sélection
Les paramètres de sélection

Jour 2 – Après-midi

Optimiser le sous et surajustement

Notions de biais d'un modèle
Notions de variance d'un modèle
Optimalité variance & biais
Jugement de la qualité d'un modèle
Méthode du Data Train / Data test
Validation croisée
Classique LOO (Leave One Out)
Validation croisée par k fold

Réaliser des exercices pratiques

Applications avec R
Démonstration avec Excel

Cas d'études sur données des apprenants

Jeux de données

Afin de s'approcher au mieux des réalités quotidiennes des praticiens, nous suggérons de nous appuyer pour l'animation pratique de thématiques et surtout de jeux de données reflétant le quotidien des apprenants.

Cet élément est un facteur de réussite pour la formation. Elle permet aux apprenants de :

Se "reconnaitre" dans les thèmes abordés,
Mieux percevoir l'intérêt des notions étudiées
S'approprier le contenu de la formation

Il sera donc pertinent que les apprenants puissent réfléchir en amont de la formation à des problématiques, jeux de données ou documents susceptibles d'être utilisés en support lors de la formation.

Outil logiciel

Cette formation n'est pas strictement dédiée à un logiciel. Les exercices et les illustrations se feront généralement sous R ou sous un autre logiciel partant de l'hypothèse que celui-ci intègre les outils techniques abordés.

Dans le cas où la formation serait effectuée avec le logiciel R, une connaissance de base de ce logiciel est préconisée.

Proposé par

GROUPE ARKESYS

"La formation maintenant pour vos talents de demain"

Voir la fiche entreprise

À partir de 1550 €

MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

Prérequis

Public admis

Financement

Modalités

Objectifs pédagogiques

Programme de la formation

GROUPE ARKESYS

MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

0 ville proposant cette formation

Demande de devis

Votre projet de formation

Vos coordonnées

Prérequis

Public admis

Financement

Modalités

Objectifs pédagogiques

Programme de la formation

GROUPE ARKESYS

Ces formations pourraient vous intéresser

MACHINE LEARNING Modèle prédictif avec les algorithmes arbres de décisions et random forests

0 ville proposant cette formation