Data Science avec Python (Scikitlearn)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Scikitlearn pour créer des modèles d'apprentissage machine
  • Concevoir des expériences et interpréter les résultats des tests A/B
  • Visualiser l'analyse de clustering et de régression en Python à l'aide de Matplotlib
  • Produire des recommandations automatisées de produit ou de contenu avec des techniques de filtrage collaboratif
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 2 280,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 2 280,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction à la Data Science (la science des données)

  • Qu'est-ce que la Data Science ?
    • Définition
    • Différence entre statistiques et Data Science
    • Champs d'application de la Data Science
    • Outils et algorithmes pour faire de la Data Science
  • Les méthodes de Machine Learning (apprentissage automatique)
    • L'apprentissage supervisé
    • L'apprentissage non supervisé
    • L'apprentissage renforcé

Le langage de programmation Python - Bases

  • Introduction à Python
  • Les structures / propriétés / fonctions spéciales
  • La Programmation Orientée Objet (POO)
  • La bibliothèque standard

Le langage de programmation Python - Avancé

  • Notions avancées de Python
  • Respecter de bonnes pratiques de développement
  • Manipuler les librairies NumPy, SciPy, Pandas et Matplotlib

Préparation de données pour la Data Science

  • Pourquoi la préparation des données est-elle si importante en Data Science ?
  • Étapes de préparation des données (du nettoyage des données à la compréhension des données)

Jour 2

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif)

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec Scikitlearn de Python
    • Extraction de caractéristiques et prétraitement
    • Réduction de la dimensionnalité avec l'Analyse des Composants Principaux (PCA)
    • Analyse de régression linéaire, multi-linéaire, polynomiale, logistique et régularisation
    • Classification supervisée
    • Classification non supervisée et régression avec arbres de décision
    • K-means clustering
    • Perceptron et le Support des Machines Vectorielles (SVM)
    • Réseaux de neurones artificiels

Jour 3

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif) - Suite

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec MLlib d'Apache Spark
    • Analyse en composantes principales
    • Analyse de régression
    • K-means clustering
    • Train / Test et validation croisée
    • Méthodes bayésiennes
    • Arbres de décision et forêts aléatoires
    • Régression multivariée
    • Modèles multiniveaux
    • Support des Machines Vectorielles (SVM)
    • Apprentissage par renforcement
    • Filtrage collaboratif
    • K plus proche voisin
    • Le compromis biais / variance
    • Apprentissage d'ensemble
    • Fréquence de terme / Fréquence inverse de documents
    • Conception expérimentale et A/B testing

Cas d'usage particuliers de Data Science

  • Algorithmes de classification / supervisés et non supervisés
    • Classification des itinéraires / chemins (basée sur les matrices origines / destinations temporelles)
    • Détection de mode de transport ou forme de mobilité à partir de jeux de données images
  • Algorithmes de recommandation
    • Filtrage collaboratif pour les recommandations : basé sur le contenu, les éléments, l'utilisateur ou filtrage hybride
  • Clustering pour les recommandations
  • Deep Learning pour les recommandations

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Une expérience de codage ou de script préalable est nécessaire. Avoir au minimum des compétences en mathématiques de niveau secondaire.

Public

Développeurs de logiciels, programmeurs, Data analysts, Data scientists.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

8 jours (56 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Présenter une vision globale des technologies et solutions les plus importantes, dans des domaines qui ne sont pas nécessairement les vôtres
  • Anticiper les évolutions des métiers de l'informatique
  • Suggérer les meilleurs conseils auprès de vos usagers ou clients
  • Reconnaître les domaines les plus actifs ayant un impact fort sur les SI actuels (voir en détail l'état de l'art des domaines suivants : architectures du SI, Cloud, technologies du Data Center, postes de travail, serveurs, virtualisation, stockage, évolution des OS, réseaux, sécurité, développement et architectures d'applications, ERP, e-commerce, CRM, décisionnel, administration...)
  • Analyser en instantané "ce qu'il se passe" et ce que l'on ne peut pas ignorer.
Tarif

A partir de 1 720,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Décrire l’enjeu des tests dans le processus de développement logiciel ;
  • Identifier les différentes catégories de test et connaitre leurs rôles ;
  • Mettre en place des tests unitaires en Python en utilisant la librairie unittest ;
  • Utiliser des objets Mocks dans les tests unitaires ;
  • Mettre en place des tests d’intégration en Python ;
  • Développer des tests d’intégration pour les fonctionnalités Web des application.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Écrire des scripts Python pour automatiser des tâches
  • Mettre en œuvre de façon efficace la programmation orientée objets de Python ainsi que les particularités du langage
  • Comprendre le rôle des librairies standards
  • Développer vos propres applications de Data Science et d’Intelligence Artificielle.
Tarif

A partir de 2 050,00 €

Durée

3j / 21h

Modes
  • Entreprise

Objectifs de la formation

Learn to administer an IBM FileNet Content Manager 5.2.1 system. Starting with an overview of the system use-cases and architecture, you learn how to configure content storage repositories, metadata, and security. You learn how to migrate your IBM FileNet P8 applications between environments, how to optimize search performance, how to use the powerful sweep framework to automate administration tasks, and how to manage the system log files.

À l'issue de ce cette formation FileNet Content Manager Administration, les participants seront à même de :

  • Identify components, features, and common use cases for IBM FileNet Component Manager
  • Use Administration Console for Content Platform Engine (ACCE) to find properties within the Global Configuration database
  • Build a FileNet P8 Repository
  • Use System Configuration Tool to create JDBC data sources for an object store
  • Identify types of content storage areas and create storage areas
  • Work with object metadata
  • Modify classes, properties, choice lists
  • Use a workflow subscription
  • Resolve login failures
  • Customize document access
  • Configure class and property security
  • Optimize search performance
  • Reindex
  • Perform searches
  • Migrate applications
  • Describe the process of moving FileNet P8 applications between environments
  • Plan and prepare for application migration
  • Import the application assets into the destination environment
  • Automate FileNet P8 asset migration with the FileNet Deployment Manager command line interface
  • Manage sweep jobs
  • Monitor system logs Prune audit entries
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Sortie en 2016, la solution Data Studio de Google permet de créer des tableaux de bord avec des données sourcées directement depuis les outils Google (principalement Google Analytics, Google Ads et Google BigQuery, mais également YouTube, GoogleCloud SQL, Attribution 360, etc.) et via les connecteurs de ses partenaires tels qu'Amazon, eBay, Facebook, Bing...

C'est donc un outil riche pour créer des reportings alimentés en temps réel, personnalisés et interactifs.

Cette formation Google Data Studio vous apportera les connaisances et compétences nécessaires pour savoir implémenter et utiliser Data Studio pour créer vos outils de reporting.

Tarif

A partir de 760,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Azure Data Factory

Proposé par M2I

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Découvrir la plateforme Azure Data Factory
  • Préparer, collecter et extraire les données
  • Travailler les données
  • Administrer et monitorer.
Tarif

A partir de 2 130,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Répondre à l'ensemble des problématiques générées par la complexité apparente des infrastructures des bâtiments et de Data Centers
  • Vous préparer à toute nouvelle réalisation, rénovation ou exploitation, avec pour principaux objectifs, la pérennité, la disponibilité et la garantie de bande passante élevée et de support des applications à haut débit jusqu'à 400 Gbps.
Tarif

A partir de 2 290,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

À l'issue de cette formation Big Data Business Intelligence vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre le vocabulaire des statisticiens
  • Éffectuer les calculs récurrents (moyennes, écart type, variance, etc.)
  • Situer la frontière entre les statistiques et les probabilités tout en sachant effectuer des calculs probabilistes simples
  • Appréhender ensuite les principales lois des statistiques afin de tester vos données
  • Choisir le bon outil pour représenter vos études statistiques et ainsi bien communiquer dessus
Tarif

A partir de 1 860,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Décrire l’analyse de bout en bout dans Microsoft Fabric
  • Utiliser Lakehouses dans Microsoft Fabric
  • Utiliser Apache Spark dans Microsoft Fabric
  • Travailler avec les tables Delta Lake dans Microsoft Fabric
  • Ingérer des données avec Dataflows Gen2 dans Microsoft Fabric
  • Utiliser les pipelines Data Factory dans Microsoft Fabric
Tarif

Contacter l'organisme

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...