Formation Cursus Data Scientist

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

À l'issue de ce cursus Data Scientist, vous serez à même de maîtriser tous les tenants et aboutissants du Big Data grâce à l'assimilation des connaissances et compétences suivantes :

  • Comprendre le vocabulaire des statisticiens et savoir effectuer des calculs récurrents
  • Savoir situer la frontière entre statistiques et probabilités
  • Savoir choisir le bon outil pour représenter vos études statistiques, et bien communiquer dessus
  • Connaître les acteurs du Big Data et leur niveau d'interdépendance
  • Connaître les spécificités d'une infrastructure Big Data : stockage de données, analyse, visualisation...
  • Manipuler des données, des objets et programmer avec R
  • Maîtriser les fonctionnalités plus avancées de R : packages, structrures de données, Rmarkdown, purr...
  • Comprendre les différences entre apprentissage automatique supervisé, non supervisé et meta-apprentissage
  • Maîtriser l’utilisation d’algorithmes d'auto-apprentissage adaptés à une solution d'analyse, et appliquer ces techniques à des projets Big Data
  • Gérer, collecter, analyser et visualiser vos données
  • Mettre en récit vos analyses pour les promouvoir en interne ou en externe

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 9 890,00 €

Durée 19 jours (133h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 9 890,00 €

Durée 19 jours (133h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Le métier de Data Scientist est apparu ces dernières années pour faire face à la multiplication des données, à la diversité de leurs formes et de leurs sources : le Big Data. Le rôle du Data Scientist : rendre les données exploitables, les traiter pour leur donner du sens et ainsi permettre à la direction générale d'adapter la stratégie de l'entreprise.

À la croisée du statisticien, du développeur et de l'expert métier, le Data Scientist doit être capable d'appréhender les évolutions majeures des nouvelles technologies d'analyse en y intégrant une nouvelle conception des dimensions. Ce n'est qu'ainsi que son objectif final d'aide à la décision sera atteint.

Pour l'entreprise, les enjeux sont multiples : devancer les besoins des clients, anticiper les risques financiers, modifier en temps réel une politique de prix, anticiper et éviter des maladies ou une panne...

Ce cursus Data Scientist vous forme directement à cette fonction en vous donnant toutes les clés pour appréhender, manipuler et restituer les données que vous aurez à analyser dans le cadre d'un projet Big Data.

Ce cursus regroupe plusieurs cours. Les dates affichées correspondent à celles du premier module de formation.

Programme

I - Comprendre les statistiques pour le Big Data ou la Business Intelligence (3 jours)

Le vocabulaire de base

Calcul fondamental en statistique descriptive

Probabilités

Tests et intervalles de confiance

Visualisation des données

L’évolution des statistiques pour le Big Data

II - Big Data : Enjeux, concepts, architectures et outils (3 jours)

Contexte et opportunités du Big Data

Sécurité éthique et enjeux juridiques du Big Data

Open data

Les projets Big Data en entreprise

Architecture et infrastructure Big Data

L’analyse des données et la visualisation

Le développement d’applications Big Data

La visualisation des données (Dataviz)

Démonstration d’un environnement distribué Hadoop

Cas d’usage et success-stories

III - Logiciel R : Prise en main (2 jours)

Présentation du logiciel R

Première prise en main du logiciel R

Les Objets

Les Fonctions et programmation R

Génération, gestion et visualisation des données

Analyses statistiques

Bilan

IV - Logiciel R : Perfectionnement et bonnes pratiques (3 jours)

Organiser son travail sous R

Manipuler facilement ses données avec le package dplyr

Exercices

Manipulation des variables catégorielles avec le package forecats

Exercices

Manipuler les chaînes de caractères avec le package stringr

Exercices

Manipuler des données de date : utilisation du package lubridate

Exercices

Assemblage de tables

Exercices

Réaliser des représentations graphiques performantes avec le package ggplot2

Générer dynamiquement son rapport d’analyse avec R Markdown

Introduction à la programmation fonctionnelle avec le package purrr

Exercices

V - Machine Learning : Introduction par la pratique (3 jours)

Introduction au monde du Big Data et de la Data Science

Un premier exemple de modélisation : la détection de Spams

Les différents types d'application du Machine Learning

Prise en main des outils

Mise en pratique sur un problème de classification

Mise en pratique sur un problème de régression

La validation des modèles : 1ère partie

Une approche non-supervisée : le clustering

Nettoyage des données : 1ère partie

Exploration et visualisation des donnéesLa validation des modèles : 2e partie

Le processus de création d'un modèle

Les méthodes ensemblistes

Le nettoyage des données : 2e partie

Le Feature Engineering

Ouverture sur le Deep Learning

VI - Big Data : Les techniques d'Analyse et de Visualisation (4 jours)

Comprendre les spécificités du Big Data

Les concepts fondamentaux et technologies associées du Big Data (stockage, recherche, visualisation)

Gestion des données structurées ou non

La collecte et exploration des données

L’analyse des données

La visualisation des données (Dataviz)

VII - Data Storytelling : Racontez l'histoire de vos données (1 jour)

Concepts clés de la mise en récit des données

Exercice

Analyse d’une présentation, création d’indicateurs de mesure de l’histoire

Exercice pratique

Rédaction d’un pitch et d’un schéma narratif

Mise en pratique 

Exercice pratique

Prise en main de l'outil de Data Storytelling de Tableau Software, en équipe

Exercice pratique

Exercice individuel de construction et de présentation d'une histoire entre les participants

Prérequis

Des connaissances de base en SQL et dans l'utilisation de Tableau Software sont également essentielles pour aborder sereinement le volet "Visualisation des données" de ce cursus.

Public

De manière générale, ce cursus Data Scientist s'adresse à toute personne amenée à évoluer vers une fonction de Data Scientist. Ce poste recoupe des profils variés : analystes, statisticiens, spécialistes BI...

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Comprendre le fonctionnement de la data science et de l'intelligence artificielle.
  • Connaître les contraintes légales et éthiques de l'intelligence artificielle.
  • Maîtriser la démarche d'innovation d'un projet d'intelligence artificielle.
  • Maîtriser la démarche de développement agile d'une application d'intelligence artificielle.
Tarif

A partir de 4 500,00 €

Durée

7 jours (49 heures)

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation Green IA vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Définir le périmètre du green IA
  • Identifier les grands postes de dépenses et de gâchis en Machine Learning
  • Assimiler l'état de l'art des alternatives en termes d'algorithmes de Machine Learning, notamment pour les réseaux neuronaux, ainsi qu'en termes de matériels hardware
  • Découvrir les leviers méthodologiques que nous pouvons utiliser à très court terme dans une démarche de Data Science
  • Contribuer à l'adoption d'un comportement d'éco-conception en Machine Learning
  • Utiliser les outils d'éco-conception en Machine Learning
  • Quantifier l'empreinte CO2 d'un modèle : de la conception à son usage en production
Tarif

A partir de 2 100,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Développer des applications de Machine Learning et d'IA (Intelligence Artificielle) avec Spark et Python
  • Utiliser la programmation parallèle sur un cluster
  • Développer et optimiser des algorithmes standards de Machine Learning et d'IA
  • Utiliser les bibliothèques Python pour le Machine Learning et d'IA
  • Décrire le cycle de vie d'un projet Data Science.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Présenter la philosophie des référentiels de données et la méthode à adopter pour mieux appréhender un projet de mise en place d'un MDM (Master Data Management)
  • Identifier les enjeux de la donnée de référence
  • Démontrer l'impact du Big Data sur la donnée de référence.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Concevoir des communications visuelles « à voir » avant d’être lues
  • Concevoir des représentations graphiques
  • Optimiser les processus de compréhension face à des constructions graphiques complexes
  • Acquérir les outils méthodologiques pour concevoir des représentations graphiques efficaces
Tarif

A partir de 1 690,00 €

Durée

2j / 14h

Modes
  • Entreprise

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

18 jours (126 heures)

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Identifier les missions du chargé de communication
  • Mettre en place des actions de communication
  • Utiliser le Web à bon escient
  • Évaluer ses actions de communication
Tarif

A partir de 1 390,00 €

Durée

13j / 91h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser les nouvelles fonctionnalités de l'architecture multi-tenant
  • Identifier les nouvelles fonctionnalités de la sécurité des base de données et de RMAN
  • Distinguer les nouvelles fonctionnalités du Data Warehousing et les améliorations apportées au Sharding.
Tarif

A partir de 1 220,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les enjeux de la Data Science et de l'IA
  • Schématiser le cycle d'un projet Data Science
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse
  • Modéliser un problème de Data Science.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

À l'issue de cette formation Data Science NLP & Speech Recognition, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Savoir structurer les données texte et voix
  • Savoir analyser un volume conséquent de données texte et/ou voix et appliquer des modèles de machine learning
  • Savoir traiter de la voix et/ou du texte en temps réel
  • Savoir mettre en place une recherche intelligente dans des documents et/ou enregistrements audio
  • Savoir créer des modèles de détection d'intention, d'entités
Tarif

A partir de 2 500,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...