PYTHON Analyses statistiques
Vous souhaitez utiliser les différents composants de l’interface Python ? Découvrez notre formation "Python - analyses statistiques"
Prérequis
- Bases de programmation en Python : importation et manipulation de données (des rappels seront effectués)
- Connaissances de base en statistique
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Utiliser les différents composants de l'interface Python
- Manipuler et nettoyer les données
- Réaliser des analyses statistiques de base (statistiques descriptives, tests d'hypothèses), de modélisation et de classification
- Être capable de récupérer et d'interpréter les résultats issus des fonctions d'analyses statistiques de Python
Programme de la formation
Introduction
- Présentation de Python : Historique
- Pourquoi utiliser Python ?
- Le langage de programmation
- Installation de Python
- Description de l'environnement et de l'interface de Python
Syntaxe du langage Python
- Conventions et règles
- Définition des blocs et des commentaires
- Les différents types de données
- Les variables
- Les différentes manipulations des types de données de base : numérique et chaîne de caractères
- Les structures conditionnelles
- Les opérateurs de comparaisons
- Les boucles : While et For
- Les fonctions
Importation de données
- Chemin d'accès
- Copier-coller
- Fichiers Excel
Définition des données en Python
- Notion de variable
- Création de variables
- Les différents types de données en Python
- Qu'est-ce qu'un « type » de données ?
- Définition des types de données
- Quels sont les différents types de manipulation de données en Python ?
La bibliothèque Pandas
- Présentation et outils de la bibliothèque
- Importation de la bibliothèque
- Les différentes structures d'objet
La bibliothèque Statsmodels
- Présentation et outils de la bibliothèque
- Importation de la bibliothèque
La bibliothèque NumPy
- Présentation et outils de la bibliothèque
- Importation de la bibliothèque
Les DataFrame
- Définition d'un DataFrame
- Construction et déclaration d'un DataFrame
- Caractéristiques d'un DataFrame
- Type
- Structure
- Manipulation des variables
- Accès et extraction des données
- Par nom de variable
- Par les indices
- Opérations sur les variables
Gestion de données manquantes
- Recherche des données manquantes
- Suppression des données manquantes
- Imputation de données manquantes
- Remplacement des données manquantes
Analyses statistiques
- Echantillonnage
- Statistiques descriptives
- Tests d'hypothèses
- Vérification des conditions de validité des tests : Tests d'adéquation
- Comparaison de deux groupes (tests paramétriques et non-paramétriques)
- Echantillons indépendants
- Echantillons appariés
- Comparaisons multiples (tests paramétriques et non-paramétriques)
- ANOVA
- Tests d'hypothèses Post-Hoc
- Modélisation statistique
- Analyse de données quantitatives : Régression linéaire simple et multiple
- Définition du modèle
- Interprétation des résultats
- Diagnostic du modèle de régression
- Détection de colinéarités
- Prédiction
- Analyse de données qualitatives : Comparaison de deux et plusieurs groupes de modalités
- Technique de clustering
- Classification automatique
- K-means
- Classification ascendante hiérarchique
Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"
Proposé par
GROUPE ARKESYS