Formation Python pour la Data Science

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre les principes fondamentaux de la programmation Python et son application à la manipulation et à l'analyse des données
  • Appliquer des techniques de nettoyage et de prétraitement des données pour préparer les ensembles de données à l'analyse
  • Créer et interpréter des visualisations de données à l'aide de bibliothèques Python
  • Développer des modèles de Machine Learning basiques pour l’analyse prédictive
  • Évaluer les performances des modèles d'apprentissage automatique

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 2 250,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 2 250,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Découvrez la puissance de Python pour la science des données avec notre cours intensif de 3 jours. Cette formation vous permet d'acquérir les compétences nécessaires pour analyser, visualiser et modéliser les données de manière efficace. De l'expérience pratique avec les bibliothèques de base de Python à la construction de modèles d'apprentissage automatique, vous acquerrez l'expertise nécessaire pour transformer vos données en informations exploitables et relever les multiples défis de la data science.

Programme

Introduction à Python pour la science des données

Les bases de la programmation Python
Introduction à la syntaxe de Python, aux types de données (chaînes, entiers, flottants), aux structures de contrôle (instructions if, boucles), aux fonctions et aux modules.
Vue d’ensemble des environnements de développement Python (Jupyter Notebooks, PyCharm).
Configuration de l’environnement Python
Installation de Python et des bibliothèques essentielles : Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn.
Environnements virtuels et gestion des paquets avec pip.
Exemples d’activités pratiques :
Mise en place d’un environnement de développement Python.
Écrire des scripts Python de base pour effectuer des manipulations de données simples.

Manipulation de données avec Pandas

Comprendre Pandas pour l’analyse de données
Exploration des objets Series et DataFrame.
Indexation, sélection, filtrage et tri des données.
Fusionner, joindre et concaténer des données.
Techniques de nettoyage des données
Gestion des valeurs manquantes, des données dupliquées et des types de données incorrects.
Traitement des données textuelles et encodage des données catégorielles.
Exemples d’activités pratiques :
Nettoyage d’un ensemble de données réelles à l’aide de Pandas.
Fusion de plusieurs ensembles de données en un seul DataFrame pour l’analyse.

Visualisation des données

Introduction à Matplotlib et Seaborn
Création de graphiques de base : graphiques linéaires, diagrammes à barres et histogrammes.
Visualisations avancées : diagrammes de dispersion, diagrammes en boîte et cartes thermiques.
Analyse visuelle des données
Utiliser les visualisations pour comprendre les distributions et les relations entre les données.
Personnaliser les graphiques avec des styles, des couleurs et des annotations.
Exemples d’activités pratiques :
Visualisation des distributions de données et des relations dans un ensemble de données.
Conception de visualisations personnalisées pour communiquer des informations sur les données.

Les bases de l’apprentissage automatique (machine learning)

Apprentissage automatique avec Scikit-learn
Vue d’ensemble de l’apprentissage supervisé et non supervisé.
Modèles de régression et de classification : Régression linéaire, régression logistique, k-voisins les plus proches.
Métriques de régression et classification et techniques d’évaluation : R²-score, erreur moyenne absolue, précision, rappel, validation croisée…
Feature engineering et sélection des modèles
Prétraitement des données pour l’apprentissage automatique.
Sélection et mise au point des modèles de machine learning.
Exemples d’activités pratiques :
Construction et évaluation d’un modèle de régression linéaire pour prédire des valeurs numériques.
Développement d’un modèle de classification pour catégoriser les points de données.

Machine Learning avancé et meilleures pratiques

Techniques avancées d’apprentissage automatique
Arbres de décision et forêts aléatoires.
Surajustement, sous-ajustement et régularisation du modèle.
Introduction aux réseaux neuronaux et aux concepts d’apprentissage profond.
Gestion de projet en science des données
Meilleures pratiques pour la collaboration dans les projets de science des données.
Considérations éthiques en science des données
Aborder la confidentialité des données, la sécurité et l’utilisation éthique des données.
Comprendre l’impact des données et des modèles biaisés.
Exemple d’activités pratiques :
Mise en œuvre d’un modèle d’arbre de décision pour améliorer les prédictions.

Prérequis

Compréhension de base des concepts de programmation.Familiarité avec les concepts mathématiques fondamentaux (statistiques et algèbre).

Public

Data scientists,

Ces formations pourraient vous intéresser

Objectifs de la formation

Découvrir Zope, le DTML et les ZPT - Savoir développer des applications Python pour Zope
Tarif

A partir de 2 475,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Décrire les concepts de data warehouse (entrepôt de données) et les besoins en architecture - Sélectionner la plateforme matérielle appropriée pour un data warehouse - Concevoir et mettre en œuvre un data warehouse - Débugger et dépanner les packages SSIS - Déployer et configurer les packages SSIS
Tarif

A partir de 2 450,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Data Management

Proposé par Sparks

Objectifs de la formation

  • Comprendre les concepts clés du Data Management
  • Identifier les données de référence et métadonnées pertinentes
  • Définir les rôles et responsabilités en Data Governance
  • Sélectionner une solution de gestion des données appropriée
  • Évaluer la qualité d'un jeu de données
  • Mettre en place une stratégie de Data Quality
  • Comprendre le contexte législatif et réglementaire autour des données
  • Appliquer les principes de sécurité et d'éthique dans la gestion des données
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Formation Big data en banque et assurance

Proposé par LEFEBVRE DALLOZ COMPETENCES

Objectifs de la formation

  • Placer les enjeux technico-économiques du big data dans leur cadre juridique
  • Déployer des projets en conformité avec les principes applicables
  • Appliquer les principes juridiques et organisationnels en matière de propriété, confidentialité et gouvernance des données
Tarif

A partir de 1 257,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Connaître les opportunités et les solutions Big Data actuelles
  • Comprendre les enjeux et les pespectives pour son entreprise
  • Pouvoir stocker, traiter, analyser et visualiser les données
  • Maîtriser les aspects ethiques et juridiques du Big Data
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Définir un Data Module sous Cognos Analytics
  • Manipuler les données et les exploiter dans des rapports et des tableaux de bord.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Exploiter les fonctionnalités de Business Intelligence Microsoft dans les outils Power BI et Excel
  • Passer la certification "Microsoft Power BI Data Analyst" (PL-300).
Tarif

A partir de 3 440,00 €

Durée

8j / 56h

Modes
  • Centre
  • Distance

Objectifs de la formation

Construire une API REST en Python avec FastAPI
Tarif

A partir de 1 975,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre le fonctionnement de la data science et de l'intelligence artificielle.
  • Connaître les contraintes légales et éthiques de l'intelligence artificielle.
  • Maîtriser la démarche d'innovation d'un projet d'intelligence artificielle.
  • Maîtriser la démarche de développement agile d'une application d'intelligence artificielle.
Tarif

A partir de 4 500,00 €

Durée

7 jours (49 heures)

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...