Initiation au Text Mining

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Importer une base de données textuelles sous R
  • Représenter les données textuelles sous un format approprié
  • Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
  • Visualiser les données textuelles
  • Effectuer une recherche d'informations
  • Effectuer une classification de documents (apprentissage supervisé)
  • Extraire des thématiques d'une base de données textuelles (apprentissage non supervisé)

GROUPE ARKESYS


La formation maintenant pour vos talents de demain
Voir la fiche entreprise

Tarif

A partir de 3 100,00 €

Durée 14 heures réparties sur 2 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

GROUPE ARKESYS


La formation maintenant pour vos talents de demain
Voir la fiche

Tarif

A partir de 3 100,00 €

Durée 14 heures réparties sur 2 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Découvrez comment transformer des données textuelles en insights précieux grâce à notre formation "Initiation au Text Mining". Apprenez des techniques essentielles pour extraire, analyser et valoriser vos données textuelles avec efficacité !

Programme

Introduction au Text Mining

  • Contexte
  • Exemple de données
  • Application du Text Mining


Particularité des données textuelles

  • Multiplicité des représentations
  • Fléau de la dimension
  • Subjectivité des données


Représentations des données textuelles

  • Sac de mots
  • Vectorisation


Pré-traitements

  • Tokenization
  • Nettoyage (majuscule, nombre, ponctuations…)
  • Stopwords
  • Stemming


Visualisation

  • Histogramme
  • Nuage de mots


Recherche d'informations

  • Comparaison de textes
  • Pondération des termes (TF-IDF…)
  • Text ranking


Application du text mining

  • Recherche d'information
  • Classification de documents
  • Analyse de sentiments
  • Classification de documents
  • Extraction de thématiques avec le modèle LDA

Prérequis

  • L'apprenant devra avoir des notions de bases en statistique (statistique descriptive, estimation), en Data Mining (apprentissage supervisé, non supervisé, ACP) ainsi que des notions de R.

Public

  • Toute personne souhaitant découvrir le Text mining et sa mise en application sous R

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Préparer, passer et obtenir votre certification officielle du CCC Big Data Foundation !
  • Connaître les fondamentaux du Big Data
  • Connaître les sources, le Data Mining et les principales technologies Big Data
  • Maîtriser les fondamentaux de Apache Hadoop et MongoDB
Tarif

A partir de 2 250,00 €

Durée

3 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier quelle méthode d'analyse multivariée ou de classification utiliser selon le contexte
  • Décrire les concepts mathématiques inhérents à ces méthodes
  • Mettre en œuvre les analyses factorielles multivariées suivantes : ACP, AFC, AFCM, AFD
  • Interpréter les résultats et les graphiques qui découlent des analyses ci-dessus
  • Maitriser les coefficients et les paramètres permettant d'estimer la qualité des analyses statistiques ci-dessus
  • Expliquer la différence entre les notions de contribution et de cosinus carré
  • Expliquer les distances et les méthodes d'agrégation les plus adaptées à l'objectif de classification
  • Comprendre les différences entre la CAH et les k-means
  • Mettre en œuvre et interpréter les résultats d'une méthode de classification de type CAH et k-means
Tarif

A partir de 3 000,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Connaître les opportunités et les solutions Big Data actuelles
  • Comprendre les enjeux et les pespectives pour son entreprise
  • Pouvoir stocker, traiter, analyser et visualiser les données
  • Maîtriser les aspects ethiques et juridiques du Big Data
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

3 jours (21 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Découvrir la Data Science et le métier de Data Scientist
  • Comprendre les concepts clés de la Data Science
  • Savoir utiliser les outils et méthodologies du Data Scientist
  • Pouvoir programmer en R ou en Python
  • Avoir des connaissances en machine learning
  • Gérer l'apprentissage supervisé, semi-supervisé et non-supervisé
  • Pouvoir intégrer la Data Science dans votre organisation
Tarif

A partir de 3 500,00 €

Durée

5 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

12 jours (84 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

18 jours (126 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

  • Apprendre à manier Pig, Hive et Impala avec Hadoop
  • Savoir explorer Pig, l'utiliser pour traiter les données basiques et complexes
  • Analyser les données relationnelles, textuelles et sémantiques avec Hive
  • Savoir utiliser Impala pour exlorer, trier, filtrer et analyser les données
  • Utiliser efficacement la complémentarité des outils
Tarif

A partir de 2 800,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Construire un modèle de données multidimensionnel à  partir des besoins des utilisateurs - Mettre en place les flux d'administration de données - Acquérir une démarche complète pour mettre en place un système décisionnel
Tarif

A partir de 2 995,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...