Formation Data Science (R et Hadoop)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

- Appliquer des techniques d'exploration des données pour améliorer la prise de décisions métier à  partir de sources de données internes et externes - Prendre une longueur d'avance sur vos concurrents avec l'analyse des données structurées et non structurées - Prédire un résultat en utilisant des techniques d'apprentissage automatique supervisé

DAWAN


Formez-vous à l’excellence.
Voir la fiche entreprise

Tarif

A partir de 3 450,00 €

Durée 5 jour(s)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

DAWAN


Formez-vous à l’excellence.
Voir la fiche

Tarif

A partir de 3 450,00 €

Durée 5 jour(s)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

  • Un support et les exercices du cours pour chaque stagiaire
  • Un formateur expert ayant suivi une formation à la pédagogie
  • Boissons offertes pendant les pauses en inter-entreprises
  • Salles lumineuses et locaux facilement accessibles
  • Méthodologie basée sur l'Active Learning : 75% de pratique minimum
  • Matériel pour les formations présentielles informatiques : un PC par participant
  • Positionnement à l'entrée et à la sortie de la formation
  • Certification CPF quand formation éligible
  • Programme

    Exploration et analyse des données avec R

    Charger, interroger et manipuler des données avec R
    Nettoyer les données brutes avant la modélisation
    Réduire les dimensions avec l'analyse en composantes principales (ACP)
    Développer les fonctionnalités de R avec les packages définis par l'utilisateur

    Faciliter la pensée analytique avec la visualisation des données

    Explorer les caractéristiques d'un ensemble de données à travers la visualisation
    Représenter graphiquement la distribution des données avec des boîtes à moustaches, des histogrammes et des diagrammes de densité
    Identifier les valeurs hors normes

    Explorer les données non structurées pour les applications métier

    Traitement préliminaire et préparation des données non structurées pour une analyse plus approfondie
    Décrire un ensemble de documents avec une matrice termes-documents

    Difficultés supplémentaires liées au Big Data

    Examiner les architectures de MapReduce et Hadoop
    Intégrer R et Hadoop à RHadoop

    Estimer les valeurs avec les règles de régression linéaire et logistique

    Modéliser la relation entre une variable de sortie et plusieurs variables d'entrée
    Interpréter correctement les coefficients des données continues et qualitatives

    Techniques de régression pour manipuler le Big Data

    Traiter les ensembles de données volumineux avec RHadoop
    Créer des modules de régression pour RHadoop

    Identification automatique de chaque nouvel élément de données

    Utiliser des arbres de décision pour prédire les valeurs cible
    Appliquer des règles de probabilité pour prédire les résultats avec le modèle Naive Bayes
    Combiner les variables de prédiction des arbres et les forêts aléatoires dans RHadoop

    Évaluer les performances des modèles

    Visualiser les performances des modèles avec une courbe ROC
    Évaluer les modèles de classification avec des matrices de confusion

    Identifier des groupes encore inconnus dans un ensemble de données

    Segmenter le marché client avec l'algorithme K-Means
    Trouver des similarités avec les mesures des distances
    Créer des clusters en forme d'arbres et des mises en cluster hiérarchiques
    Mettre en cluster les tweets et les fichiers texte pour mieux les comprendre

    Mettre à jour les connexions avec l'analyse des associations

    Identifier les connexions importantes avec l'analyse des réseaux sociaux
    Comprendre l'utilisation des résultats de l'analyse des réseaux sociaux à des fins marketing

    Définir et évaluer des règles d'association

    Identifier les préférences réelles des clients à partir d'un ensemble de données transactionnelles pour améliorer l'expérience utilisateur
    Calculer les indices de support et de confiance et le lift pour différencier les bonnes règles des mauvaises

    Prérequis

    Connaissances en matière de programmation et de statistiques sont utiles sans toutefois être obligatoires

    Public

    Professionnels des bases de données, managers, analystes de données, data scientists et assistants à  maîtrise d'ouvrage. Cette formation est très utile pour les professionnels chargés de gérer les prévisions et les tendances

    Ces formations pourraient vous intéresser

    Objectifs de la formation

    • Comprendre la démarche de l'algorithme Svm
    • Comprendre les avantages et les inconvénients du knn
    • Comprendre les principes mathématiques sous-jacents au SVM
    • Comprendre la notion de noyau
    • Choisir un noyau approprié à une problématique
    • Trouver les réglages optimaux des hyper paramètres des noyaux
    • Valider le modèle en appliquant les différentes méthodes de validation
    • Mettre en œuvre sous des logiciels comme R l'algorithme Svm
    Tarif

    A partir de 1 550,00 €

    Durée

    2j / 14h

    Modes
    • Centre
    • Entreprise
    • Distance

    Objectifs de la formation

    A l'issue de cette formation, vous serez capable de :

    • Créer une cartographie de vos sources de données
    • Gérer la continuité de la donnée et des sources de données
    • Organiser la structure et l'architecture de vos données d'un point de vue entreprise.
    Tarif

    A partir de 860,00 €

    Durée

    1j / 7h

    Modes
    • Centre
    • Distance

    Objectifs de la formation

    A l'issue de cette formation, vous serez capable de :

    • Identifier les grandes catégories fonctionnelles de la salle informatique / Data Center
    • Reconnaître les missions spécifiques à chacune des fonctions et les principes généraux de leur mise en oeuvre
    • Décrire la nature des risques induits par l'existence de la salle informatique et les moyens de de leur gestion spécifique
    • Recenser les principales normes et réglementations applicables en phase de conception et en contexte d'exploitation courante.
    Tarif

    Contacter l'organisme

    Durée

    1j / 7h

    Modes
    • Centre
    • Distance

    Objectifs de la formation

    Synchroniser ses sources de données avec Google Looker Studio - Créer des rapports d'analyse dynamique - Mettre en avant ses KPI - Partager ses rapports
    Tarif

    A partir de 975,00 €

    Durée

    1j / 7h

    Modes
    • Centre
    • Entreprise
    • Distance

    Objectifs de la formation

    • Décrire les composants, architecture et nature d'une solution de BI
    • Créer une base de données multidimensionnelle avec Analysis Services
    • Créer et configurer des cubes et des dimensions
    • Créer et configurer des mesures et des groupes de mesures dans un cube
    • Interroger un cube avec MDX
    • Personnaliser un cube
    • Créer une base de données tabulaire avec Analysis Services
    • Utiliser DAX pour personnaliser un modèle tabulaire
    • Décrire l'analyse prédictive avec Data Mining
    Tarif

    Contacter l'organisme

    Durée

    3j / 21h

    Modes
    • Centre
    • Entreprise
    • Distance

    Objectifs de la formation

    • Cette formation fait l'objet d'une évaluation formative.
    Tarif

    Contacter l'organisme

    Durée

    3 jours (21 heures)

    Modes
    • Distance
    • Centre

    Objectifs de la formation

    • Cette formation fait l'objet d'une évaluation formative.
    Tarif

    Contacter l'organisme

    Durée

    3 jours (21 heures)

    Modes
    • Entreprise
    • Distance
    • Centre

    Objectifs de la formation

    A l'issue de cette formation, vous serez capable de :

    • Enumérer les cas d'usage de vRealize Operations
    • Décrire les caractéristiques et avantages de vRealize Operations
    • Déterminer le cluster vRealize Operations qui répond à vos besoins de surveillance
    • Déployer et configurer un cluster vRealize Operations
    • Utiliser les fonctionnalités de l'interface pour évaluer et résoudre les problèmes opérationnels
    • Décrire les certificats vRealize Operations
    • Créer des politiques pour répondre aux besoins opérationnels de votre environnement
    • Reconnaître les moyens efficaces d'optimiser les performances, la capacité et les coûts dans les Data Centers
    • Dépanner et gérer les problèmes à l'aide de Workbench, des alertes et des tableaux de bord prédéfinis
    • Gérer les configurations
    • Configurer la surveillance des applications en utilisant VMware vRealize Application Remote Collector
    • Créer des définitions de symptômes et d'alertes, des rapports et des vues personnalisés
    • Créer divers tableaux de bord personnalisés à l'aide du canevas
    • Configurer des widgets et leurs interactions pour les tableaux de bord
    • Créer des "Super Mesures"
    • Configurer des utilisateurs et des groupes d'utilisateurs pour contrôler l'accès à votre environnement
    • Etendre les capacités de vRealize Operations en ajoutant des packs de gestion et en configurant des solutions
    • Surveiller l'état du cluster vRealize Operations à l'aide de tableaux de bord d'autosurveillance.
    Tarif

    Contacter l'organisme

    Durée

    5j / 35h

    Modes
    • Centre
    • Distance

    Formation IT Contracts and Personal Data Protection

    Proposé par LEFEBVRE DALLOZ COMPETENCES

    Objectifs de la formation

    • Utiliser le vocabulaire technique et juridique lié aux contrats informatiques et à la protection des données personnelles
    • Rédiger les clauses associées des contrats internationaux complexes
    • Identifier les risques encourus en cas de non-conformité
    Tarif

    A partir de 1 240,00 €

    Durée

    1 jour

    Modes
    • Entreprise
    • Centre
    • Distance

    Objectifs de la formation

    • Créer un package avec R Studio
    • Décrire le package
    • Ajouter des données au package
    • Créer et ajouter des fonctions
    • Documenter le package, décrire les données et les fonctions du package
    • De tester le package
    • Partager le package
    • Créer des vignettes
    Tarif

    A partir de 4 650,00 €

    Durée

    3j / 21h

    Modes
    • Centre
    • Entreprise
    • Distance

    Je cherche à faire...