Prérequis
- L'apprenant devra avoir des notions de bases en statistique (statistique descriptive, estimation), en Data Mining (apprentissage supervisé, non supervisé, ACP) ainsi que des notions de R.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Importer une base de données textuelles sous R
- Représenter les données textuelles sous un format approprié
- Préparer les données en effectuant les principaux pré-traitements spécifiques aux données textuelles
- Visualiser les données textuelles
- Effectuer une recherche d'informations
- Effectuer une classification de documents (apprentissage supervisé)
- Extraire des thématiques d'une base de données textuelles (apprentissage non supervisé)
Programme de la formation
Introduction au Text Mining
- Contexte
- Exemple de données
- Application du Text Mining
Particularité des données textuelles
- Multiplicité des représentations
- Fléau de la dimension
- Subjectivité des données
Représentations des données textuelles
- Sac de mots
- Vectorisation
Pré-traitements
- Tokenization
- Nettoyage (majuscule, nombre, ponctuations…)
- Stopwords
- Stemming
Visualisation
- Histogramme
- Nuage de mots
Recherche d'informations
- Comparaison de textes
- Pondération des termes (TF-IDF…)
- Text ranking
Application du text mining
- Recherche d'information
- Classification de documents
- Analyse de sentiments
- Classification de documents
- Extraction de thématiques avec le modèle LDA

Proposé par
GROUPE ARKESYS
"La formation maintenant pour vos talents de demain"

Proposé par
GROUPE ARKESYS
