Formation Data Scientist : niveau avancé

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Découvrir et utiliser la puissance prédictive des modèles ensemblistes
  • Savoir effectuer un "feature engineering" performant
  • Appréhender les techniques de text-mining et de deep-learning à travers d'exemples concrets
  • Enrichir ses outils de data scientist

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Dans l'univers du Big Data, le rôle du data scientist joue est primordial pour valoriser les données.

Cette formation Data Scientist Avancé vous apprend les modèles statistiques et les techniques d'analyse des données qui vous aideront à exploiter vos données.

Ce cours est animé par des data scientists en activité. Ils vous font bénéficier de leur retour d'expérience de modèles réels mis en place chez leurs clients et de leur expérience des compétitions de Data Science.

Programme

Rappel des fondamentaux Data Scientist

Ecosystème du Big Data et Data Scientist
Comment modéliser un problème de data science ?
Les différentes familles d’algorithmes (supervisé : classification/régression, non supervisé)
Les algorithmes classiques
Comment évaluer la performance ?
Sur apprentissage et compromis biais/variance

Modèles ensemblistes

Rappels
Pourquoi ça fonctionne ? Raisons théoriques
Introduction au stacking
Architecture et promesses du stacking
Feature weighted stacking

Mise en application

Introduction au text mining

Un modèle de représentation : le bag of words
Normalisations usuelles
Stemming, lemmatization
Distances (Levenshtein, Hamming, Jaro-Winkler)
Word2Vec

Feature engineering avancé

Normalisation
Qu’est ce que la normalisation ?
Quand l’utiliser ?
Réduction de dimension (ACP, TSNE, LSA, etc.)
Transformation et interactions entre variables
Traitement des variables catégorielles à haute dimensionnalité
Création de variables extraites d’arbres (Facebook Trick)

Réseaux de neurones et deep learning

L’origine : le perceptron
Les réseaux de neurones
Deep learning
Objectif : s’affranchir du feature engineering manuel
Convolution
Réseaux récurrent

Cas concret

Reconnaissance de chiffres

Apprentissage semi-supervisé

Rappels et révisions

Synthèse des points abordés les deux premiers jours
Approfondissement des sujets sélectionnés avec l’intervenant

Mise en pratique

Le dernier jour de ce stage est entièrement consacré à des mises en pratique

Sélection et participation à une compétition

Le formateur sélectionnera une compétition en cours sur Kaggle qui sera démarrée en jour 3 par l’ensemble des participants

Prérequis

Pour suivre cette formation, il est recommandé d'avoir des connaissances de base en programmation ou en scripting. Il faut également avoir suivi la Formation "Fondamentaux de la Data Science" (OFDS) ou avoir les connaissances équivalentes.

Public

le cours s'adresse aux data scientists, analystes, statisticiens, architectes et développeurs souhaitant approfondir leurs connaissances sur la Data Science.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Utiliser les spécificités du langage R pour l'exploration des données
  • Réaliser des analyses en composantes, des modélisations
  • Maîtriser les algorithmes supervisés et non-supervisés
  • Connaître les procédures d'évaluation de modèles
  • Pouvoir réaliser une analyse de données textuelles
Tarif

A partir de 3 000,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre les enjeux de la donnée à travers les outils BI du marché
  • Prendre en main les solutions Tableau, Power BI, Google Data Studio
  • Créer son premier tableau de bord
Tarif

A partir de 2 050,00 €

Durée

3j / 21h

Modes
  • Entreprise

Objectifs de la formation

À l'issue de cette formation Cisco Software-Defined Access (SDA), vous aurez acquis les connaissances et compétences nécessaires pour :

  • Discuss the Cisco Software-Defined Access solution and describe the solution components and architecture
  • Understand the functions and role of Cisco DNA Center and Cisco ISE, in particular their integration
  • Understand Cisco’s Intent-Based Networking solution, in particular DNA Automation and Assurance
  • Deploy a network segmentation policy using Cisco Software-Defined Access solutions, namely Cisco TrustSec
  • Deploy a Cisco Software-Defined Access solution and connect it to external domains such as data centers and remote/branch offices using IP, Cisco Software- Defined Access and SD-WAN transits
  • Deploy Cisco Software-Defined Access wireless in both traditional OTT and fabric operational modes
  • Troubleshoot a Cisco Software-Defined Access solution using appropriate CLI and DNA Center tools
Tarif

A partir de 3 900,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre ce qu’est l’IA, la data, et être en mesure d’interagir avec confiance avec les équipes data d’une organisation
  • Analyser le potentiel et les limites de la GenAI dans la gestion de projet
  • Concevoir des workflows et des processus efficaces alimentés par l'IA
  • Appliquer des techniques de prompt engineering pour résoudre des défis réels de project management
  • Évaluer les outils et les solutions d'IA générative et déterminer s'ils conviennent à des contextes de projet spécifiques
  • Créer un plan d'intégration des outils IA pour des frameworks ou référentiels de gestion de projet existants
Tarif

A partir de 1 800,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l’issue de cette formation Spring Cloud Stream et Kafka, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Mettre en place l'environnement de développement Spring Cloud Data Stream
  • Concevoir une architecture microservices basée sur Kafka et Spring Cloud
  • Adopter une programmation fonctionnelle
  • Mettre en place une topologie de processeurs Kafka avec SpringBoot
  • Surveiller et récolter les métriques d’une telle architecture
Tarif

A partir de 1 480,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expérimenter les options de calcul et de stockage pour les workloads de Data Engineering dans Azure
  • Exécuter des requêtes interactives à l'aide de pools SQL sans serveur
  • Effectuer l'exploration et la transformation des données dans Azure Databricks
  • Explorer, transformer et charger des données dans le Data Warehouse à l'aide d'Apache Spark
  • Ingérer et charger des données dans le Data Warehouse
  • Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Intégrer les données à partir des notebooks avec Azure Data Factory ou Azure Synapse Pipelines
  • Prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
  • Assurer la sécurité end-to-end avec Azure Synapse Analytics
  • Effectuer un traitement de flux en temps réel avec Stream Analytics
  • Créer une solution de traitement de flux avec Event Hubs et Azure Databricks.
Tarif

A partir de 2 680,00 €

Durée

4j / 28h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Comprendre le processus de Machine Learning et les principaux modèles d'apprentissage
  • Connaître et savoir utiliser les principales librairies Python pour la data science
  • Ecrire un programme simple de ML avec scikit-learn, tensorflow et Q-learning
Tarif

A partir de 1 390,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Applications Data Visualisation, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Définir les principes fondamentaux de la visualisation de données
  • Identifier les enjeux juridiques de la gestion de données
  • Déterminer les technologies et APIS pour la visualisation de données
  • Utiliser les principaux frameworks pour créer des applications de datavisualisation
Tarif

A partir de 2 490,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...