Formation Data Scientist : Les fondamentaux de la Data Science

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

Plus concrètement, à l'issue de cette formation Data Scientist Fondamentaux vous aurez acquis les connaissances et compétences nécessaires pour :

  • Découvrir le métier de Data Scientist et les grandes familles de problèmes
  • Savoir modéliser un problème de Data Science
  • Créer vos premières variables
  • Constituer votre boîte à outils de Data Scientist
  • Participer à une première compétition.

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Le métier de Data Scientist est apparu ces dernières années pour faire face à la multiplication des données, à la diversité de leurs formes et de leurs sources : le Big Data. Le rôle du Data Scientist : rendre les données exploitables, les traiter pour leur donner du sens et ainsi permettre à la direction générale d'adapter la stratégie de l'entreprise. C'est donc un acteur-clé aux compétences multiples.

Cette formation Data Scientist Fondamentaux se concentre sur l'aspect technique de ce métier. Vous découvrirez les méthodes et les outils du Data Scientist et partagerez les retours d'expériences des formateurs. Des exercices pratiques et la participation à une compétition vous permettront d'expérimenter vos nouvelles connaissances.

Programme

Jour 1
Introduction au Big Data

Qu’est-ce-que le Big Data ?
L’écosystème technologique du Big Data

Introduction à la Data Science, le métier de Data Scientist

Le vocabulaire d’un problème de Data Science
De l’analyse statistique au machine learning
Overview des possibilités du machine learning

Modélisation d’un problème

Input / ouput d’un problème de machine learning

Travaux Pratiques « OCR» :

Comment modéliser le problème de la reconnaissance optique de caractère

Identifier les familles d’algorithmes de machine learning

Analyse supervisée
Analyse non supervisée
Classification / régression

Sous le capot des algorithmes : la régression linéaire

Quelques rappels : fonction hypothèse, fonction convexe, optimisation
La construction de la fonction de coût
Méthode de minimisation : la descente de gradient

Sous le capot des algorithmes : la régression logistique

Frontière de décision
La construction d’une fonction de coût convexe pour la classification

La boîte à outil du Data Scientist

Introduction aux outils
Introduction à Python, Pandas et Scikit-learn

Cas pratique n°1 : « Prédire les survivants du Titanic »

Exposé du problème
Première manipulation en Python

Jour 2
Rappels et révisions du jour 1
Qu’est-ce qu’un bon modèle ?

Cross-validation
Les métriques d’évaluation : precision, recall, ROC, MAPE, etc

Les pièges du machine learning

Overfitting ou sur-apprentissage
Biais vs variance
La régularisation : régression Ridge et Lasso

Data Cleaning

Les types de données : catégorielles, continues, ordonnées, temporelles
Détection des outliers statistiques, des valeurs aberrantes
Stratégie pour les valeurs manquantes

Travaux Pratiques :

« Remplissage des valeurs manquantes»

Feature Engineering

Stratégies pour les variables non continues
Détecter et créer des variables discriminantes

Cas pratique n°2 : « Prédire les survivants du Titanic »

Identification et création des bonnes variables
Réalisation d’un premier modèle
Soumission sur Kaggle

Data visualisation

La visualisation pour comprendre les données : histogramme, scatter plot, etc
La visualisation pour comprendre les algorithmes : train / test loss, feature importance, etc

Introduction aux méthodes ensemblistes

Le modèle de base : l’arbre de décision, ses avantages et ses limites
Présentation des différentes stratégies ensemblistes : bagging, boosting, etc

Travaux Pratiques "Retour sur le Titanic" :

Utilisation d’une méthode ensembliste sur la base du précédent modèle

Apprentissage semi-supervisé

Les grandes classes d’algorithmes non supervisées : clustering, PCA, etc

Travaux Pratiques « Détection d’anomalies dans les prises de paris» :

Comment un algorithme non supervisé permet-il de détecter des fraudes dans les prises de paris?

Jour 3
Rappels et révisions

Synthèse des points abordés en journées 1 et 2
Approfondissement des sujets sélectionnés avec l’intervenant

Mise en pratique

Le dernier jour est entièrement consacré à des mises en pratique

Sélection et participation à une compétition

Le formateur sélectionnera une compétition en cours sur Kaggle ou datascience.net qui sera démarrée en jour 3 par l’ensemble des participants

Prérequis

Pour suivre ce cours dans les meilleures conditions possibles, il vous faut avoir certaines connaissances de base en programmation ou scripting, ainsi que quelques souvenirs de statistiques qui peuvent être un plus.

Public

Ce stage s'adresse aux Analystes, Statisticiens, Architectes, Développeurs.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Maîtriser les éléments fondamentaux des assurances collectives et leur mise en place dans l’entreprise
  • Maîtriser les volets Santé, Prévoyance, Retraite
  • Connaître les contrat de complémentaire santé et le contrat de prévoyance complémentaire
Tarif

A partir de 1 550,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

À l'issue de cette formation Designing Cisco Data Center Infrastructure vous aurez acquis les connaissances et les compétences nécessaires pour : 

  • Faire des choix de conception pour optimiser les performances de l'infrastructure du centre de données, la virtualisation, la sécurité et l'automatisation
  • Maîtriser les connaissances pratiques et théoriques nécessaires pour concevoir un centre de données évolutif, fiable et intelligent basé sur les technologies Cisco
  • Se qualifier pour des postes de niveau professionnel dans le domaine très demandé des environnements de centres de données d'entreprise
  • Décrire les options et les protocoles de transfert de la couche 2 et de la couche 3 utilisés dans un centre de données
  • Décrire les options de conception des racks, les modèles de trafic et l'accès, l'agrégation et le noyau de la couche de commutation du centre de données
  • Décrire la technologie Cisco Overlay Transport Virtualization (OTV) qui est utilisée pour interconnecter les centres de données
  • Décrire le protocole de séparation Locator/ID
  • Concevoir une solution qui utilise le réseau local extensible virtuel (VXLAN) pour le transfert du trafic
  • Décrire les options de redondance matérielle ; comment virtualiser le réseau, les fonctions de calcul et de stockage ; et la mise en réseau virtuelle dans le centre de données
  • Décrire les solutions qui utilisent des extensions de fabric et comparer Cisco Adapter Fabric Extender (FEX) avec la virtualisation entrée/sortie à racine unique (SR-IOV : single root input/output virtualization)
  • Décrire les menaces et les solutions de sécurité dans le centre de données
  • Décrire les technologies avancées de sécurité des centres de données et les best practices
  • Décrire la gestion et l'orchestration des appareils dans le centre de données
  • Décrire les options de stockage pour la fonction de calcul et les différents niveaux de RAID (Redundant Array of Independent Disks) du point de vue de la haute disponibilité et des performances
  • Décrire les concepts, les topologies, l'architecture et les termes de l'industrie Fibre Channel
  • Décrire Fibre Channel over Ethernet (FCoE)
  • Décrire les options de sécurité dans le réseau de stockage
  • Décrire les options de gestion et d'automatisation de l'infrastructure de réseau de stockage
  • Décrire les serveurs UCS Cisco et les cas d'utilisation pour diverses plateformes UCS Cisco
  • Expliquer les options de connectivité pour les interconnexions en tissu pour les connexions vers le sud et vers le nord
  • Décrire la solution hyperconvergente et les systèmes intégrés
  • Décrire les paramètres de l'ensemble du système pour la mise en place d'un domaine UCS Cisco
  • Décrire le contrôle d'accès basé sur les rôles (RBAC : role-based access control) et l'intégration avec les serveurs d'annuaire pour contrôler les droits d'accès sur Cisco UCS Manager
  • Décrire les pools qui peuvent être utilisés dans les profils de service ou les modèles de profils de service sur Cisco UCS Manager
  • Décrire les différentes politiques dans le profil de service
  • Décrire les politiques d'interface Ethernet et Fibre Channel et les technologies réseau supplémentaires
  • Décrire les avantages des modèles et la différence entre les modèles initiaux et les modèles mis à jour
  • Décrire les outils d'automatisation des centres de données
Tarif

A partir de 4 140,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, cette formation Certification ISTQB foundation vous apportera les connaissances et compétences nécessaires pour :

  • Identifier les compétences essentielles requises pour le test
  • Comprendre les concepts fondamentaux du test logiciel
  • Accroître l'efficacité et l'efficience des tests en utilisant des outils
  • Découvrir l’ensemble des activités liées au test
  • Identifier les facteurs qui influencent les priorités et les efforts liés aux tests
  • Connaître les risques et les bénéfices liés à l'automatisation des tests
  • Comprendre en quoi la gestion des risques est essentielle à l’activité de test
  • S’organiser & Travailler au sein d'une équipe agile

Cette formation ainsi que l'examen associé ISTQB Foundation se basent sur la version 2024. L'obtention de la certification internationale ISTQB® permet de démontrer l'acquisition d'un niveau de connaissance et de compétences en test de logiciels.

Tarif

A partir de 1 890,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les fondamentaux du droit du travail
  • Adapter une gestion du personnel en prévenant les risques de contentieux
Tarif

A partir de 1 950,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance
  • Entreprise

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire les fondamentaux de la Blockchain
  • Reconnaître les implications juridiques et réglementaires
  • Analyser les principales applications pratiques de la Blockchain
  • Développer des compétences spécifiques dans le domaine de la Blockchain
  • Maintenir une veille constante sur les évolutions et les tendances significatives dans le domaine de la Blockchain.
Tarif

A partir de 1 900,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire une vision globale d'un Système de Management des Informations Privées (SMIP)
  • Expliquer les fondamentaux du Règlement Général européen de Protection des Données personnelles
  • Définir les interactions entre ISO 27001 / 27002 et ISO 27701 / 27552.
Tarif

A partir de 760,00 €

Durée

1j / 7h

Modes
  • Centre
  • Distance

Objectifs de la formation

Concrètement, cette formation Implemmenting and Operating Cisco Data Center vous apportera les compétences et connaissances nécessaires pour :

  • Mettre en œuvre des protocoles de routage et de commutation dans un environnement de centre de données.
  • Mettre en œuvre des réseaux superposés dans un centre de données
  • Introduire les concepts de haut niveau de l'infrastructure Cisco Application Centric Infrastructure (Cisco ACI™) et l'intégration du domaine Cisco Virtual 
  • Machine manager (VMM).
  • Décrire le service de cloud computing Cisco et les modèles de déploiement
  • Mettre en œuvre la structure Fibre Channel
  • Mise en œuvre de la structure unifiée Fibre Channel over Ethernet (FCoE)
  • Mettre en œuvre les fonctions de sécurité dans le centre de données
  • Mettre en œuvre la gestion des logiciels et la surveillance de l'infrastructure
  • Mettre en œuvre Cisco UCS Fabric Interconnect et l'abstraction de serveur
  • Mettre en œuvre la connectivité SAN pour Cisco Unified Computing System™ (Cisco UCS®)
  • Décrire les concepts et les avantages de l'infrastructure Cisco HyperFlex™
  • Mettre en œuvre les outils d'automatisation et de scripting Cisco dans le centre de données.
  • Évaluer les technologies d'automatisation et d'orchestration
Tarif

A partir de 4 090,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre les principes fondamentaux de la sécurité applicative
  • Identifier les principales vulnérabilités des applications
  • S'approprier les méthodes, techniques et outils de protection
  • S'entraîner à protéger ses applications contre les failles logicielles
  • Connaître les processus d'audit de code
Tarif

A partir de 2 800,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Réaliser des présentations de données de qualité pour tous types d’audience
  • Construire des schémas narratifs cohérents et convaincants à partir de jeux de données
  • Acquérir la bonne posture pour devenir acteur de ses présentations
  • Se constituer une boîte à outils et mettre en œuvre les meilleures pratiques de visualisation
Tarif

A partir de 800,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation Deep Learning, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Maitriser les concepts fondamentaux du Deep learning et leur origine
  • Identifier les principaux types de réseaux de neurones (simples, convolutifs, récursifs, etc.)
  • Savoir quand les utiliser ?
  • Appréhender les modèles de Deep Learning plus avancés (auto-encodeurs, gans, apprentissage par renforcement, …)
  • Appréhender les bases théoriques et pratiques d'architecture et de convergence de réseaux de neurones
  • Comprendre en quoi consiste la mise en œuvre concrète des réseaux de neurones
  • Utiliser un framework de référence : Keras de TensorFlow
Tarif

A partir de 2 090,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...