Formation Data Science : Natural Language Processing (NLP) et Speech Recognition

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

À l'issue de cette formation Data Science NLP & Speech Recognition, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Savoir structurer les données texte et voix
  • Savoir analyser un volume conséquent de données texte et/ou voix et appliquer des modèles de machine learning
  • Savoir traiter de la voix et/ou du texte en temps réel
  • Savoir mettre en place une recherche intelligente dans des documents et/ou enregistrements audio
  • Savoir créer des modèles de détection d'intention, d'entités

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 2 500,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Les données non structurées issues du langage sont omniprésentes en entreprise (mails, appels téléphoniques, visio, réunions, avis, commentaires, etc.) mais ne sont que rarement utilisées. Les progrès en Deep Learning ont toutefois permis de rendre plus accessible l'exploitation des données voix et texte.

Cette formation Data Science NLP & Speech Recognition prépare les data scientists à maîtriser les données texte et voix au sein d'un contexte technologique innovant et en particulier au cours d'un projet d'Intelligence Artificielle.

À travers des exercices, vous apprendrez à structurer et créer des modèles de machine learning sur ces données du langage. À la fin de la session, vous disposerez d'une compréhension solide du potentiel et de l'état de l'art en Natural Language Processing (NLP) et en Speech Processing. Les mises en pratique vous permettront d'être indépendant pour déployer et créer de la valeur sur ces données, et devenir un expert du traitement automatique du langage écrit et parlé.

Programme

Jour 1

Introduction au domaine de l'analyse du texte et de la voix

NLP, NLU, Speech processing et understanding

Natural Language Processing (NLP)

Les bases du NLP : encoding, regex, tokenisation(n-grams) bag of words
NLP : la réduction de dimensions
Nettoyer le texte : stemming, lemmatisation
Topic modeling : SVD, NMF, LDA
Word embedding : Word2vec, FastText, etc.

Information Retrieval (IR) : créer un moteur de recherche

Indexation de contenu, moteur recherche simple
Réaliser un moteur de recherche intelligent

Jour 2

Natural Language Understanding (NLU)

Les cas d’usages au travers de mises en pratique :
- Créer un modèle simple d’analyse de sentiments
- Créer un modèle simple de détection d’intention
- Créer un modèle simple de détection d'entités NER
Méthodologie avancée :
- Mettre en place un modèle de machine learning sur du texte (analyse de sentiment, etc.)
- Modélisation deep learning : Sequence, Bert, HuggingFace
Consommer une API de NLP :
- Utiliser une API externe

Jour 3

Speech Processing

Introduction à la donnée audio : signal numérique, encodage
Speech recognition :
- Entraîner un modèle de speech to text (trigger word detection)
- Utiliser un modèle de speech to text complet (API Cloud, modèle pré-entraîné)

Speech Understanding

Les cas d’usages :
- Détection intention
- Analyse de sentiments
Speech analysis :
- Représentation : transformée de Fourier, spectrogramme mel MFCC, (librosa, pyaudio)
- Les particularité du langage parlé : syntaxe, gestion du débit de parole, erreur de transcription
- Speaker Embedding : caractériser le timbre, l’intonation de la voix

Prérequis

Pour suivre cette formation Data Science NLP & Speech Recognition, il est nécessaire d'avoir des connaissances générales sur le Machine Learning ainsi qu'en statistiques. Des notions de base en Python sont également demandées.
Il est par ailleurs indispensable d'avoir suivi une formation d'introduction à la Data Science telle que la formation Data Scientist : Les fondamentaux de la Data Science (OFDS).

Public

Ce cours Data Science NLP & Speech Recognition s'adresse aux :

Ces formations pourraient vous intéresser

Objectifs de la formation

À l'issue de cette formation Big Data Architecture Infrastructure, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre l’écosystème Big Data dans sa globalité (concepts, technologies, architecture)
  • Analyser les risques et les difficultés propres à un projet Big Data
  • Comprendre l’origine et le format des données manipulées
  • Appréhender les éléments de sécurité, d'éthique et les enjeux juridiques
  • Connaître les architectures distribuées dominantes du marché
  • Se repérer dans les technologies Big Data pour concevoir une architecture performante en fonction des projets
  • Mettre en œuvre un cluster Hadoop et l’exploiter
  • Déployer une application Hadoop/Spark sur une architecture Big Data
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

1 jour ( 7 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation Green IA vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Définir le périmètre du green IA
  • Identifier les grands postes de dépenses et de gâchis en Machine Learning
  • Assimiler l'état de l'art des alternatives en termes d'algorithmes de Machine Learning, notamment pour les réseaux neuronaux, ainsi qu'en termes de matériels hardware
  • Découvrir les leviers méthodologiques que nous pouvons utiliser à très court terme dans une démarche de Data Science
  • Contribuer à l'adoption d'un comportement d'éco-conception en Machine Learning
  • Utiliser les outils d'éco-conception en Machine Learning
  • Quantifier l'empreinte CO2 d'un modèle : de la conception à son usage en production
Tarif

A partir de 2 100,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise

Objectifs de la formation

À l'issue de cette formation Dataiku, vous aurez acquis les connaissances nécessaires pour :

  • Installer et configurer Dataiku DSS
  • Savoir utiliser le logiciel depuis l'interface ou depuis des API
  • Être capable de préparer vos données dans Dataiku DSS
  • Comprendre comment manipuler les graphiques et les statistiques
Tarif

A partir de 1 610,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Acquérir, nettoyer et transformer des données
  • Modeler des données pour la performance et l’évolutivité
  • Concevoir et créer des rapports pour l’analyse des données
  • Appliquer et réaliser des analyses de rapports avancées
  • Gérer et partager des éléments de rapports
  • Créer des rapports paginés dans Power BI
Tarif

A partir de 2 100,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

3 jours (21 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

À l'issue de cette formation Google Cloud Platform : l'Essentiel du Big Data et du Machine Learning vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Découvrir les objectifs et la valeur des principaux produits Big Data et Machine Learning disponibles dans la plate-forme Google Cloud
  • Utiliser Cloud SQL et Cloud Dataproc pour migrer les workloads MySQL et Hadoop / Pig / Spark / Hive existants vers Google Cloud Platform
  • Utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
  • Former et utiliser un réseau de neurones en utilisant TensorFlow
  • Employer des API ML
  • Choisir parmi différents produits de traitement de données sur Google Cloud Platform
Tarif

A partir de 790,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Talend Data Integration vous aurez acquis les connaissances et compétences nécessaires pour :

  • Utiliser Talend Open Studio for Data Integration
  • Créer, exécuter, dupliquer et exporter un Job
  • Extraire des données d'une base de données et de formats de fichiers communs
  • Transformer et intégrer les données dans des cibles.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Définir et préparer l'environnement de développement
  • Préparer les données pour la modélisation
  • Effectuer l'ingénierie des fonctionnalités
  • Développer des modèles
Tarif

Contacter l'organisme

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation VMware NSX-T Dépannage, vous aurez acquis les connaissances et compétences nécessaires pour : 

  • Use the native tools available in NSX-T Data Center to identify and troubleshoot the problems related to NSX-T Data Center environment
  • Use VMware vRealize Log Insight and VMware vRealize Network Insight to identify and troubleshoot the problems related to the NSX-T Data Center environment
  • Explain the NSX-T Data Center infrastructure components and the communications between them
  • Identify, analyze, and troubleshoot the following problems related to the NSX-T Data Center
  • Management, control, data planes, installation, and upgrade
  • Logical switching and logical routing
  • Identify, analyze, and troubleshoot network security problems related to the NSX-T Data Center distributed
  • firewall, Gateway firewall, service insertion, and endpoint protection
  • Identify, analyze, and troubleshoot problems related to VPN and load balancer services
  • Identify the components and packet flows involved in the NSX-T Data Center datapath and troubleshoot various problems that could occur in the datapath
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...