XLSTAT Analyses multivariées, classification et PLS (ACP, CAH, K-MEANS, AFD, PLS)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
  • Décrire les concepts mathématiques inhérents à ces méthodes
  • Mettre en œuvre les analyses suivantes : ACP, CAH, K-MEANS, AFD, PLS
  • Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
  • Expliquer la différence entre les notions de contribution et de cosinus carré 
  • Identifier les contextes d'utilisation des différentes versions de la régression PLS
  • Comprendre les concepts mathématiques inhérents à la régression PLS
  • Interpréter les résultats et les graphiques qui découlent des analyses

GROUPE ARKESYS


La formation maintenant pour vos talents de demain
Voir la fiche entreprise

Tarif

A partir de 6 200,00 €

Durée 28 heures réparties sur 4 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

GROUPE ARKESYS


La formation maintenant pour vos talents de demain
Voir la fiche

Tarif

A partir de 6 200,00 €

Durée 28 heures réparties sur 4 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Optimisez vos analyses avec notre formation "XLSTAT : Analyses multivariées, classification et PLS". Maîtrisez les techniques avancées comme l'ACP, CAH, K-MEANS, AFD et PLS pour des décisions éclairées et une compréhension approfondie de vos données.

Programme

Prise en main de l'interface d'XlStat

  • Généralités et interface utilisateur
    • Interface de base
    • Rappel sur quelques outils Excel nécessaires à la manipulation d'XlStat.
    • Activation, chargement et fermeture d'XlStat 
    • Gestion et organisation des données
    • L'interface XlStat
    • Menus et barre d'outils
    • Principes de paramétrage des boîtes de dialogue
    • Gestion des classeurs et des feuilles Excel
    • Paramétrage de base de l'outil
    • Présentations des différentes analyses statistiques disponibles
    • Complémentarités entre Excel et XlStat
  • Outils XlStat non statistiques 
    • Repérage de données selon critères
    • Différents types de fonctionnalités de préparation des données 
    • Regroupement des données en classes
    • Transformation de données
    • Outils complémentaires aux graphiques (étiquettes, axes, facteur de zoom…)
    • Codage de données

 

Généralités sur les différentes méthodes d'analyses multidimensionnelles

  • Limites des statistiques classiques
  • Champs d'application des différentes méthodes d'analyses multidimensionnelles
  • Introduction sur le data mining - Les objectifs
    • Objectifs de description
    • Objectifs de prédiction
  • Structure des jeux de données
  • Présentation de l'éventail des méthodes
    • Analyse en composantes principales
    • Analyse factorielle des correspondances simples et multiples
    • Analyse factorielle discriminante
    • Méthodes de classification : classification ascendante hiérarchique, k-means
    • Régressions PLS et PLS-DA
  • Principes généraux des différentes méthodes - Notions de : 
    • Distance, 
    • Inertie et variance 
    • Axes factoriels
    • Variables latentes


Notions de corrélation

  • Définition du coefficient de corrélation
  • Interprétation de la valeur du coefficient de corrélation
  • Les confusions : corrélation, causalité, pente…
  • Les différents coefficients de corrélation
    • Coefficient de Pearson
    • Coefficient de Spearman


Mise en œuvre d'une Analyse en Composante principales (ACP)

  • Structure du jeu de données et contexte d'application
  • Objectifs détaillés de l'ACP
  • Choix des axes de représentation (choix du nombre de composantes principales)
  • Interprétation des sorties graphiques : cercle factoriel et graphique des individus
  • Interprétation des axes factoriels
  • Contribution des individus et des variables aux axes
  • Qualité de représentation des individus et des variables sur les axes : les cosinus carrés
  • Les différentes ACP :
    • ACP normée et non normée
    • ACP non paramétrique
  • Positionnement d'une variable illustrative catégorielle
  • Les confusions et erreurs à ne pas commettre
  • Présentation rapide des Analyses des correspondances simple et multiple si souhaité
  • Différences entre ACP et AFC


Mise en œuvre d'une classification par une classification ascendante hiérarchique (CAH)

  • Présentation des objectifs de la classification ascendante hiérarchique
  • Structure du jeu de données
  • Choix de la distance
  • Choix du linkage (saut, critère de « rapprochement » entre les classes) : méthode de Ward…
  • Lecture d'un dendrogramme
  • Choix du nombre de classes
  • Classification sur les individus
  • Classification sur les variables
  • Interprétation des sorties logiciel


Mise en œuvre d'une classification par une k-means

  • Présentation des objectifs de la méthode des k-means
  • Avantages et inconvénients de la CAH et des k-means
  • Détermination des clusters
  • Présentation des différentes versions de l'algorithme
  • Utilisation de la k-means en complément de l'ACP
  • Classification sur grand jeu de données
  • Conseils de mise en œuvre 
  • Interprétation des sorties logiciel


Mise en œuvre d'une analyse factorielle fiscriminante (AFD)

  • Structure du jeu de données et contexte d'application
  • Objectifs détaillés de l'AFD
  • Notions de classement et de discrimination
  • Méthodologie de l'AFD
  • Comparaison avec l'ACP
  • Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
  • Qualité de l'AFD (de la discrimination obtenue)
    • Tests univariés et multivariés (lambda de Wilks)
    • Graphique des individus
    • Matrice de confusion (et éventuellement courbe ROC)
  • Les confusions et erreurs à ne pas commettre


Mise en œuvre d'une analyse discriminante PLS (PLS-DA)

  • Problématique :
    • Des multi colinéarités
    • Des petits échantillons
  • Présentation de la PCR (Principal Component Regression)
  • Méthodologie générale de PLS
  • Présentation des différentes versions de la régression PLS
  • Structure du jeu de données et contexte d'application de la PLS-DA
  • Objectifs détaillés de la PLS-DA
  • Choix du nombre de composante de la PLS : critère du Q carré
  • Interprétation des sorties logiciel : cercle factoriels, corrélations variables x axes
  • Importance des variables pour la discrimination des groupes : les VIP
  • Qualité de la PLS-DA
    • Indicateurs Q carrés et R carrés
    • Matrice de confusion
  • Les confusions et erreurs à ne pas commettre


Mise en œuvre d'une régression PLS

  • Contexte et objectifs
  • Présentation des différentes méthodes de régression sur des données colinéaires : PCR, régression de Ridge et PLS
  • Principes et concepts mathématiques inhérents à la PCR et la régression PLS
  • Présentation des différentes versions de la régression PLS
  • Mise en œuvre et interprétation des résultats : graphiques, coefficients du modèle…
  • Choix du nombre de composantes (validation croisée)
  • Composantes et coefficients de régression
  • Qualité d'ajustement, qualité de prédiction
  • Coefficients Q² et R²
  • Importance des variables explicatives pour la prédiction
    • Coefficients normalisés
    • VIP
  • Sélection de variables

Prérequis

  • Il est nécessaire que les participants aient de bonnes connaissances sur les outils statistiques de base : corrélation, écart-type, variance, intervalles de confiance, tests d'hypothèses.

Public

  • Toute personne souhaitant comprendre et mettre en œuvre les procédures d'analyses factorielles multivariées en intégrant la régression PLS avec mise en application sous XlStat

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Acquérir, nettoyer et transformer des données
  • Modeler des données pour la performance et l’évolutivité
  • Concevoir et créer des rapports pour l’analyse des données
  • Appliquer et réaliser des analyses de rapports avancées
  • Gérer et partager des éléments de rapports
  • Créer des rapports paginés dans Power BI
Tarif

A partir de 2 100,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les contextes d'utilisation des outils de type ACP, AFC, ACH
  • Interpréter les graphiques issus de ces analyses (cercles factoriels, dendrogrammes, …)
  • Connaître les principes de bases des méthodes de classification
Tarif

A partir de 1 550,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Excel - Atelier Listes de données et Tableaux croisés

Proposé par CIT FORMATION INFORMATIQUE

Objectifs de la formation

Toute personne qui souhaite gérer des données sur Excel et pouvoir réaliser des analyses et des tableaux de bords évolués.

À l'issue de la formation, le stagiaire sera capable de :

  • Préparer son tableau de données pour optimiser son exploitation
  • Réaliser des tris, filtres, sous-totaux
  • Réaliser des analyses de données avec les tableaux croisés

Methodes et outils pédagogiques

  • Alternance exposés théoriques et exercices pratiques (80% pratique)
  • Support de cours adapté au logiciel étudié et au niveau suivi
  • Assistance téléphonique gratuite et illimitée
Tarif

Contacter l'organisme

Durée

1 jour(s)

Modes
  • Entreprise
  • Distance

Objectifs de la formation

  • Appliquer les techniques de gestion par classes d'actifs
  • Assurer des analyses macro-économique
  • Mettre en œuvre une analyse quantitative
  • Interpréter la réglementation et la déontologie
Tarif

A partir de 4 800,00 €

Durée

80 heures

Modes
  • Entreprise

Objectifs de la formation

  • Comprendre l’intérêt des examens de laboratoire en fonction des différentes pathologies (diagnostic, suivi)
  • Comprendre les principes de base des différentes technologies liées à la réalisation des analyses
  • Contribuer à l’amélioration des relations entre les services de soins et les laboratoires grâce à une bonne compréhension des exigences des cliniciens
Tarif

A partir de 1 160,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
  • Décrire les concepts mathématiques inhérents à ces méthodes
  • Mettre en œuvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
  • Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
  • Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
  • Expliquer la différence entre les notions de contribution et de cosinus carré
  • Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
  • Comprendre les différences entre la CAH et les k-means
  • Mettre en œuvre et interpréter les résultats d'une méthode de classification de type CAH et k-means
Tarif

A partir de 3 000,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Maitriser la vérification technique des marqueurs biochimiques analysés par des techniques classiques, en tenant compte de la qualité de l’échantillon et des pièges analytiques
  • Interpréter des bilans en fonction des situations analytiques et physiopathologiques
Tarif

A partir de 1 740,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Connaître la physiopathologie de la thyroïde
  • Evaluer la pertinence des demandes d’analyses en fonction des indications cliniques
  • Interpréter les résultats : importance du dialogue biologiste-clinicien
  • Maîtriser lechniques de dosage et leurs limites
  • Situer l’impact des analyses et aider à l’interprétation clinique
  • Démontrer l’importance de la phase pré-analytique
Tarif

A partir de 1 160,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Utilisateur Excel souhaitant maitriser les fonctionnalités avancées d’Excel afin d’être en mesure de concevoir des tableaux bords percutants pour bien gérer et suivre l’activité.

À l'issue de la formation, le stagiaire sera capable de :

  • Concevoir des tableaux de bord clairs et calculer des indicateurs clés
  • Savoir gérer des suivis et réaliser des analyses de synthèses
  • Mesurer les résultats de son activité à l'aide de statistiques

Methodes et outils pédagogiques

  • Alternance exposés théoriques et exercices pratiques (80% pratique)
  • Support de cours adapté au logiciel étudié et au niveau suivi
  • Assistance téléphonique gratuite et illimitée
Tarif

Contacter l'organisme

Durée

1 jour(s)

Modes
  • Entreprise
  • Distance

Objectifs de la formation

  • Connaitre les concepts centraux de l'analyse de survie / des durées de vie
  • Connaitre le vocabulaire dédié à ce type d'analyse
  • Identifier les contextes d'utilisation des outils de l'analyse de survie / durée de vie
  • Connaitre les fonctions de risque instantané, de risque cumulé, de survie et de survie cumulée
  • Réaliser des analyses non paramétriques de données de survie 
  • Réaliser des représentations graphiques (courbe de survie, survie cumulée, méthode KM ou actuarielle
  • Connaitre la modélisation semi-paramétrique et réaliser son diagnostic
  • Connaitre les cas d'utilisation de la modélisation paramétrique
  • Connaitre la distribution des temps
  • Connaitre la modélisation paramétrique
Tarif

A partir de 6 200,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...