Data Science avec Python (Scikitlearn)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Scikitlearn pour créer des modèles d'apprentissage machine
  • Concevoir des expériences et interpréter les résultats des tests A/B
  • Visualiser l'analyse de clustering et de régression en Python à l'aide de Matplotlib
  • Produire des recommandations automatisées de produit ou de contenu avec des techniques de filtrage collaboratif
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 2 280,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 2 280,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction à la Data Science (la science des données)

  • Qu'est-ce que la Data Science ?
    • Définition
    • Différence entre statistiques et Data Science
    • Champs d'application de la Data Science
    • Outils et algorithmes pour faire de la Data Science
  • Les méthodes de Machine Learning (apprentissage automatique)
    • L'apprentissage supervisé
    • L'apprentissage non supervisé
    • L'apprentissage renforcé

Le langage de programmation Python - Bases

  • Introduction à Python
  • Les structures / propriétés / fonctions spéciales
  • La Programmation Orientée Objet (POO)
  • La bibliothèque standard

Le langage de programmation Python - Avancé

  • Notions avancées de Python
  • Respecter de bonnes pratiques de développement
  • Manipuler les librairies NumPy, SciPy, Pandas et Matplotlib

Préparation de données pour la Data Science

  • Pourquoi la préparation des données est-elle si importante en Data Science ?
  • Étapes de préparation des données (du nettoyage des données à la compréhension des données)

Jour 2

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif)

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec Scikitlearn de Python
    • Extraction de caractéristiques et prétraitement
    • Réduction de la dimensionnalité avec l'Analyse des Composants Principaux (PCA)
    • Analyse de régression linéaire, multi-linéaire, polynomiale, logistique et régularisation
    • Classification supervisée
    • Classification non supervisée et régression avec arbres de décision
    • K-means clustering
    • Perceptron et le Support des Machines Vectorielles (SVM)
    • Réseaux de neurones artificiels

Jour 3

Exemples de travaux pratiques sur Scikitlearn (à titre indicatif) - Suite

  • Maîtriser les techniques d'apprentissage automatique et d'exploration de données avec MLlib d'Apache Spark
    • Analyse en composantes principales
    • Analyse de régression
    • K-means clustering
    • Train / Test et validation croisée
    • Méthodes bayésiennes
    • Arbres de décision et forêts aléatoires
    • Régression multivariée
    • Modèles multiniveaux
    • Support des Machines Vectorielles (SVM)
    • Apprentissage par renforcement
    • Filtrage collaboratif
    • K plus proche voisin
    • Le compromis biais / variance
    • Apprentissage d'ensemble
    • Fréquence de terme / Fréquence inverse de documents
    • Conception expérimentale et A/B testing

Cas d'usage particuliers de Data Science

  • Algorithmes de classification / supervisés et non supervisés
    • Classification des itinéraires / chemins (basée sur les matrices origines / destinations temporelles)
    • Détection de mode de transport ou forme de mobilité à partir de jeux de données images
  • Algorithmes de recommandation
    • Filtrage collaboratif pour les recommandations : basé sur le contenu, les éléments, l'utilisateur ou filtrage hybride
  • Clustering pour les recommandations
  • Deep Learning pour les recommandations

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Une expérience de codage ou de script préalable est nécessaire. Avoir au minimum des compétences en mathématiques de niveau secondaire.

Public

Développeurs de logiciels, programmeurs, Data analysts, Data scientists.

Ces formations pourraient vous intéresser

PYTHON Programmer en Python

Proposé par GROUPE ARKESYS

Objectifs de la formation

  • Décrire la philosophie de Python et identifier ses domaines d'application ;
  • Mettre en place un environnement de développement pour Python ;
  • Écrire des scripts en utilisant l'algorithmie de base du langage Python et les exécuter ;
  • Définir et utiliser des fonctions et des modules pour la structuration des programmes ;
  • Mettre en œuvre les concepts de la programmation orientée objet avec le langage Python ;
  • Implémenter des classes avec des attributs et des méthodes ;
  • Mettre en œuvre les concepts de la programmation objet (encapsulation, polymorphisme et héritage) ;
Tarif

A partir de 6 200,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Développer des applications de Machine Learning et d'IA (Intelligence Artificielle) avec Spark et Python
  • Utiliser la programmation parallèle sur un cluster
  • Développer et optimiser des algorithmes standards de Machine Learning et d'IA
  • Utiliser les bibliothèques Python pour le Machine Learning et d'IA
  • Décrire le cycle de vie d'un projet Data Science.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des flux simples de l'ETL Data Services.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Mettre en place l'environnement de développement ;
  • Maîtriser l'architecture de développement de la librairie PyQt
  • Utiliser des composant d'IHM
  • Gérer le positionnement des composant d'IHM
  • Gérer les événements des composant d'IHM
  • Mettre en place et gérer l'architecture de développement MVC
  • Créer une application de type MDI (Multiple Document Interface)
  • Réaliser des opération de tracé
  • Gérer les styles et les thème graphique
  • Internationaliser une application graphique avec PyQt
  • Utiliser Qt Designer pour générer du code
Tarif

A partir de 4 650,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Concevoir une interface graphique avec WPF
  • Utiliser le Two Way Data Binding
  • Gérer le positionnement des composants
  • Décrire le pattern MVVM
  • Utiliser et créer des composants graphiques
  • Exploiter les possibilités du langage XAML
  • Utiliser Microsoft Blend.
Tarif

A partir de 2 440,00 €

Durée

4j / 28h

Modes
  • Centre
  • Distance

Objectifs de la formation

Implémenter une couche de persistance performante avec Spring Data JPA
Tarif

A partir de 1 275,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Gérer et mettre en place une sécurité complète sur du contenu dans SAP Analytics Cloud
  • Utiliser Business Content Network pour partager du contenu entre plusieurs tenants SAP Analytics Cloud
  • Auditer et surveiller l'utilisation d'un système SAP Analytics Cloud avec SAP Administration Cockpit
  • Configurer SAP Analytics Cloud pour authentifier les utilisateurs en utilisant un Identity Provider personnalisé (SAP NetWeaver)
  • Configurer et activer l'authentification SSO via le MFA (Multi Factor Authentication) et via les réseaux sociaux (X (ex Twitter), Facebook, LinkedIn, Google) dans SAP Analytics Cloud
  • Identifier les différents types de connexion aux sources de données depuis SAP Analytics Cloud
  • Installer et configurer des composants logiciels (SAP Cloud Connector, SAP Cloud Agent) pour créer et utiliser des connexions en mode Import à des sources de données On-Premise (base de données SQL, serveur de fichiers) et Cloud (SAP SuccessFactors)
  • Mettre en place, créer et utiliser des connexions en mode Live (direct, SAML SSO, par tunnel) à des sources de données On-Premise (SAP HANA, SAP S/4HANA, SAP BI4) et Cloud SAP (S/4HANA Cloud, SAP HANA Cloud)
  • Installer et configurer le composant SAP Data Provisioning Agent pour combiner plusieurs modèles de données dans une connexion (Blending SAP)
  • Identifier les bonnes pratiques pour troubleshooter les connexions en mode Live et en mode Import.
Tarif

A partir de 4 100,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Souligner les avantages de la nouvelle base de données SAP "In-Memory" sur laquelle se base SAP BW/4HANA
  • Décrire les nouvelles interfaces utilisées dans SAP BW/4HANA (SAP BW/4HANA Cockpit, SAP BW/4HANA Modeling Tools)
  • Supporter un projet de migration de SAP BW vers SAP BW/4HANA d'un point de vue applicatif
  • Décrire le cadre d'architecture SAP LSA++ et fournir des lignes directrices sur les possibilités d'adaptation d'une architecture existante
  • Utiliser conjointement la modélisation native SAP HANA et les InfoProviders BW dans les scénarios dits "mixtes"
  • Mettre en oeuvre les concepts de multi-température des données dans SAP BW/4HANA
  • Fournir un aperçu des méthodes d'approvisionnement de données dans SAP BW/4HANA, notamment l'interface Big Data et le streaming temps réel basé sur SAP HANA Smart Date Integration
  • Extraire des données, effectuer des statistiques sur BW en utilisant le concept de Core Data Services
  • Décrire l'impact que SAP S/4HANA peut avoir sur une stratégie SAP BW, notamment par l'utilisation des analytiques embarqués.
Tarif

A partir de 4 100,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser le plug-in EsayCatalog avec InDesign
  • Mettre en page des catalogues connectés et automatisables.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

Comprendre le processus d'intégration de données - Maîtriser l'outil Talend Open Studio et la bibliothèque de composants
Tarif

A partir de 1 895,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...