Data Science - Les fondamentaux

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les enjeux de la Data Science et de l'IA
  • Schématiser le cycle d'un projet Data Science
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse
  • Modéliser un problème de Data Science.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction à la Data Science

  • Qu'est-ce que la Data Science ?
  • Différence entre statistiques, Data Science et IA
  • Champs d'application de la Data Science
  • Outils et algorithmes pour faire la Data Science
  • Les cycles d'un projet Data Science

L'apprentissage automatique

  • L'apprentissage
    • Automatique dans le passé
    • Supervisé
    • Non supervisé
    • Renforcé

Rappel Python

  • Introduction à Python
  • Les structures / propriétés / fonctions spéciales
  • La programmation orientée objet
  • Manipuler les librairies :
    • NumPy
    • SciPy
    • Pandas
    • Matplotlib

Les algorithmes de l'apprentissage automatique

  • Réduction de la dimensionnalité avec l'Analyse en Composantes Principales (ACP)
  • Analyse de régression linéaire, multilinéaire, polynomiale, logistique et régularisation
  • Classification supervisée
  • Classification non supervisée et régression avec arbres de décision
  • KNN (K-Nearest Neighbors)
  • Le K-Means clustering
  • Le perceptron et le support des machines vectorielles (SVM)
  • Réseaux de neurones artificiels

Exemples de travaux pratiques (à titre indicatif)

  • Réalisation d'un projet Data Science de bout en bout
    • Collecte des besoins et de l'objectif du projet
    • Exploration des données avec Python
    • Visualisation avec Matplotlib
    • Nettoyage des données
    • Imputation des valeurs manquantes (avec moyenne, médiane, most frequent, KNN)
    • Réduction de la dimension avec une ACP
  • Entraînement de modèles de Machine Learning selon différents algorithmes et comparaison des performances selon différentes métriques

Jour 2

Les indispensables de la Data Science

  • Cross-validation
  • Les métriques d'évaluation
  • Overfitting ou surapprentissage
  • Biais vs variance
  • Etapes de préparation des données (du nettoyage des données à la compréhension des données)
  • Feature Engineering
  • Data Visualisation
  • La malédiction de la dimension
  • Bonnes pratiques

Exemples de travaux pratiques (à titre indicatif)

  • Reprise du projet précédent, ingénierie des attributs, amélioration de la qualité des données, et réapprentissage

Data Science et le Big Data

  • Initiation aux traitements parallèles avec Spark MLlib

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir des connaissances de base en statistiques et de l'expérience avec le langage Python.

Public

Développeurs de logiciels, programmeurs, Data Analysts et/ou statisticiens.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Décrire l’analyse de bout en bout dans Microsoft Fabric
  • Utiliser Lakehouses dans Microsoft Fabric
  • Utiliser Apache Spark dans Microsoft Fabric
  • Travailler avec les tables Delta Lake dans Microsoft Fabric
  • Ingérer des données avec Dataflows Gen2 dans Microsoft Fabric
  • Utiliser les pipelines Data Factory dans Microsoft Fabric
Tarif

Contacter l'organisme

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Réaliser du scraping de données
  • Faire les actions d'ingestion nécessaires pour alimenter un Data Lake.
Tarif

A partir de 2 010,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

Utiliser Spring Data MongoDB.
Tarif

A partir de 1 875,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Centre
  • Distance

Objectifs de la formation

Décrire les concepts de data warehouse (entrepôt de données) et les besoins en architecture - Sélectionner la plateforme matérielle appropriée pour un data warehouse - Concevoir et mettre en œuvre un data warehouse - Débugger et dépanner les packages SSIS - Déployer et configurer les packages SSIS
Tarif

A partir de 2 450,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser le plug-in EsayCatalog avec InDesign
  • Mettre en page des catalogues connectés et automatisables.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Implémenter des protocoles de routage et de commutation dans l'environnement de Data Centers
  • Mettre en oeuvre des réseaux superposés dans un Data Center
  • Appliquer les concepts de haut niveau de Cisco Application Centric Infrastructure (Cisco ACI) et l'intégration du domaine Cisco Virtual Machine Manager (VMM)
  • Décrire le service de Cloud Computing Cisco et les modèles de déploiement
  • Implémenter la structure Fibre Channel
  • Mettre en oeuvre la structure unifiée Fibre Channel over Ethernet (FCoE)
  • Implémenter des fonctions de sécurité dans le Data Center
  • Mettre en oeuvre la gestion des logiciels et la surveillance de l'infrastructure
  • Implémenter Cisco UCS Fabric Interconnect et l'abstraction de serveur
  • Mettre en oeuvre la connectivité SAN pour Cisco Unified Computing System (Cisco UCS)
  • Décrire les concepts et les avantages de l'infrastructure Cisco HyperFlex
  • Implémenter des outils d'automatisation et de scripting Cisco dans le Data Center
  • Evaluer les technologies d'automatisation et d'orchestration.
Tarif

A partir de 4 060,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Concevoir des activités pour les apprenants
  • Mettre en place plus d’interactivité dans une classe avec google Workspace
  • Faciliter le travail collaboratif dans et hors la classe
Tarif

A partir de 850,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

  • Expliquer les concepts des Bases de données dans Azure
  • Expliquer les concepts des données relationnelles dans Azure
  • Expliquer les concepts des données non relationnelles dans Azure
  • Identifier les composants d’un entrepôt de données moderne dans Azure
Tarif

A partir de 750,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...