Formation Analyse statistique et modélisation
Avec l'avènement des technologies Big Data, l'analyse de données est au centre de la stratégie de bon nombre d'entreprises. Bien conduite, elle permet d'extraire de la valeur de grands ensembles de données, en identifiant des informations métiers utiles. Cette formation de 2 jours vous permettra d'acquérir les connaissances de base en statistiques et analyse prédictive, avec des logiciels comme RStudio, indispensable outil pour l'analyse de données.
Objectifs pédagogiques
- Savoir analyser et modéliser les données statistiques
- Comprendre les fondamentaux de la statistique descriptive
- Savoir utiliser les paramètres de position et de dispersion
- Maîtriser la statistique inférentielle
- Savoir modéliser une analyse statistique
Programme de la formation
Introduction
Les grands principes et enjeux de l’analyse de données
De l’analyse statistique au Deep Learning : bref retour historique sur le traitement des données
Business Intelligence vs. Data Mining
Fondamentaux de la statistique descriptive
Définition de la statistique descriptive
Analyse d’une population
Méthodes d’échantillonnage
Variables qualitatives et quantitatives
Effectifs et calcul des fréquences
Effectifs cumulés croissants et décroissants
Représentation graphique des variables qualitatives et quantitatives
Exercices
Paramètre de position et de dispersion
Mode, valeur modale, valeur la plus probable
Moyenne d’une population (ou d’un échantillon)
Médiane, partager une série numérique
Étendue, différence entre valeurs extrêmes
Utiliser les quantiles
Écart-type, calculer la dispersion d’un ensemble de données
Calcul de la variance et de la covariance
Exercices
Statistique inférentielle
Mesures d’association
Notions sur la génération de nombres au hasard et de variable aléatoire
Loi de probabilité
Loi des grands nombres et théorème de la limite centrale
Intervalles de confiance
Tests d’hypothèses
Analyse de la variance à un facteur, deux facteurs
Exercices
Démarche et modélisation d’une analyse statistique
Les grands principes de la modélisation
Ouverture sur l’apprentissage supervisé et non-supervisé : vers la Data Science
Régression linéaire simple
Régression linéaire multiple
Analyse discriminante linéaire
Régression logistique
Exercices

Proposé par
Sparks
"Tout l'IT, vraiment tout"

Proposé par
Sparks
