Formation Python pour la Data Science

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre les principes fondamentaux de la programmation Python et son application à la manipulation et à l'analyse des données
  • Appliquer des techniques de nettoyage et de prétraitement des données pour préparer les ensembles de données à l'analyse
  • Créer et interpréter des visualisations de données à l'aide de bibliothèques Python
  • Développer des modèles de Machine Learning basiques pour l’analyse prédictive
  • Évaluer les performances des modèles d'apprentissage automatique

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 2 250,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 2 250,00 €

Durée 3 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Découvrez la puissance de Python pour la science des données avec notre cours intensif de 3 jours. Cette formation vous permet d'acquérir les compétences nécessaires pour analyser, visualiser et modéliser les données de manière efficace. De l'expérience pratique avec les bibliothèques de base de Python à la construction de modèles d'apprentissage automatique, vous acquerrez l'expertise nécessaire pour transformer vos données en informations exploitables et relever les multiples défis de la data science.

Programme

Introduction à Python pour la science des données

Les bases de la programmation Python
Introduction à la syntaxe de Python, aux types de données (chaînes, entiers, flottants), aux structures de contrôle (instructions if, boucles), aux fonctions et aux modules.
Vue d’ensemble des environnements de développement Python (Jupyter Notebooks, PyCharm).
Configuration de l’environnement Python
Installation de Python et des bibliothèques essentielles : Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn.
Environnements virtuels et gestion des paquets avec pip.
Exemples d’activités pratiques :
Mise en place d’un environnement de développement Python.
Écrire des scripts Python de base pour effectuer des manipulations de données simples.

Manipulation de données avec Pandas

Comprendre Pandas pour l’analyse de données
Exploration des objets Series et DataFrame.
Indexation, sélection, filtrage et tri des données.
Fusionner, joindre et concaténer des données.
Techniques de nettoyage des données
Gestion des valeurs manquantes, des données dupliquées et des types de données incorrects.
Traitement des données textuelles et encodage des données catégorielles.
Exemples d’activités pratiques :
Nettoyage d’un ensemble de données réelles à l’aide de Pandas.
Fusion de plusieurs ensembles de données en un seul DataFrame pour l’analyse.

Visualisation des données

Introduction à Matplotlib et Seaborn
Création de graphiques de base : graphiques linéaires, diagrammes à barres et histogrammes.
Visualisations avancées : diagrammes de dispersion, diagrammes en boîte et cartes thermiques.
Analyse visuelle des données
Utiliser les visualisations pour comprendre les distributions et les relations entre les données.
Personnaliser les graphiques avec des styles, des couleurs et des annotations.
Exemples d’activités pratiques :
Visualisation des distributions de données et des relations dans un ensemble de données.
Conception de visualisations personnalisées pour communiquer des informations sur les données.

Les bases de l’apprentissage automatique (machine learning)

Apprentissage automatique avec Scikit-learn
Vue d’ensemble de l’apprentissage supervisé et non supervisé.
Modèles de régression et de classification : Régression linéaire, régression logistique, k-voisins les plus proches.
Métriques de régression et classification et techniques d’évaluation : R²-score, erreur moyenne absolue, précision, rappel, validation croisée…
Feature engineering et sélection des modèles
Prétraitement des données pour l’apprentissage automatique.
Sélection et mise au point des modèles de machine learning.
Exemples d’activités pratiques :
Construction et évaluation d’un modèle de régression linéaire pour prédire des valeurs numériques.
Développement d’un modèle de classification pour catégoriser les points de données.

Machine Learning avancé et meilleures pratiques

Techniques avancées d’apprentissage automatique
Arbres de décision et forêts aléatoires.
Surajustement, sous-ajustement et régularisation du modèle.
Introduction aux réseaux neuronaux et aux concepts d’apprentissage profond.
Gestion de projet en science des données
Meilleures pratiques pour la collaboration dans les projets de science des données.
Considérations éthiques en science des données
Aborder la confidentialité des données, la sécurité et l’utilisation éthique des données.
Comprendre l’impact des données et des modèles biaisés.
Exemple d’activités pratiques :
Mise en œuvre d’un modèle d’arbre de décision pour améliorer les prédictions.

Prérequis

Compréhension de base des concepts de programmation.Familiarité avec les concepts mathématiques fondamentaux (statistiques et algèbre).

Public

Data scientists,

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Concevoir des activités pour les apprenants
  • Mettre en place plus d’interactivité dans une classe avec google Workspace
  • Faciliter le travail collaboratif dans et hors la classe
Tarif

A partir de 850,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

À l'issue de cette formation Python Calcul Scientifique, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Calculer, estimer et inférer dans des data-set réels, bruités et de dimension importante
  • Augmenter un data-set
  • Réaliser des calculs plus précis
  • Détecter des motifs approchant dans une bibliothèque de séquences
  • Réaliser des prédictions sur des séries temporelles
  • Dépoter les calculs sur des architectures matérielles optimisées pour les calculs sans modifier le code
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Dépanner les technologies niveau 2, telles que STP (Spanning Tree Protocol), port channel, vPC, Cisco FabricPath et FEX
  • Implémenter des composants de Data Center tels que les commutateurs Cisco Nexus 9000, 7000, 5000 et MDS ainsi que les Nexus 2000 Fabric Extenders
  • Dépanner la First Hop redondance, le routage et le CFS (Cisco Fabric Services) dans le Data Center
  • Décrire les serveurs Cisco UCS
  • Dépanner les solutions de virtualisation, telles que OTV, VRF et VXLAN
  • Dépanner les réseaux de la zone de stockage, y compris Fibre Channel, FCoE, Zoning, NPV et NPIV
  • Dépanner l'informatique unifiée du Data Center.
Tarif

A partir de 4 260,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Formation IBM QRadar SIEM - Avancé

Proposé par PLB CONSULTANT

Objectifs de la formation

Savoir tirer parti des possibilités de la plateforme IBM QRadar pour sécuriser encore davantage vos réseaux.

À l'issue de cette formation IBM QRadar SIEM Avancé, les participants auront acquis les compétences et connaissances nécessaires pour :

  • Learn how to create custom log sources
  • Discover how to work with reference data collections and custom rules
  • Use X-Force data and Threat Intelligence app
  • Use the Use Case Manager app
  • Learn how to use UBA and QRadar Advisor
  • Discover Tuning
  • Explore Custom action scripts
  • Discuss Integration with IBM SOAR
Tarif

A partir de 1 590,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Maîtriser la syntaxe du langage Python
  • Acquérir les notions essentielles de la programmation objet
  • Connaître et mettre en oeuvre les différents modules Python
Tarif

A partir de 1 390,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Intelligence Artificielle Responsable, vous serez en mesure de :

  • Prendre conscience des problèmes d’éthique en Data Science
  • Découvrir les différentes typologies de problèmes
  • Appréhender les responsabilités de chacun
  • Favoriser l'interprétabilité des modèles
  • Détecter les biais discriminatoires et les corriger
Tarif

A partir de 1 090,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les principes fondamentaux du Machine Learning pour une mise en oeuvre adaptée d'un projet d'Intelligence Artificielle
  • Décrire les concepts d'apprentissage automatique et l'évolution du Big Data vers le Machine Learning
  • Définir les enjeux de l'utilisation du Machine Learning, incluant les bénéfices attendus et des exemples d'usage
  • Identifier le positionnement du Machine Learning dans la chaîne de traitement de la donnée
  • Reconnaître les outils et les acteurs leaders du marché
  • Décrire les principaux algorithmes et la démarche projet à appliquer selon les cas d'usages en entreprise
  • Identifier les clés de réussite d'un projet intégrant du Machine Learning.
Tarif

A partir de 1 720,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • S'approprier les principes fondamentaux pour utiliser Docker (conteneurs, images, volumes...)
  • Connaître les spécificités de conteneurisation d'APIs
  • Gérer son propre hub de conteneurs
  • Déployer un pipeline data dans le Cloud
Tarif

A partir de 3 000,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Cette formation Certification Big Data Foundation du CCC (Cloud Credential Council) vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Comprendre le phénomène Big Data et les notions qu’il recouvre
  • Expliquer le Data Mining
  • Appréhender les outils applicables au process Big Data
  • Comprendre et installer les technologies du Big Data : Hadoop et MongoDB
  • Réaliser les contraintes, les limites mais aussi l’intérêt du mode inductif permis par le Big Data
  • Passer dans les conditions optimales la certification internationale «Big Data Foundation» du CCC, Cloud Credential Council.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

1 jour ( 7 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Je cherche à faire...