Ce diplôme est actuellement inactif et a été remplacé par Data Science : savoir collecter, décrypter, analyser et prédire à partir de mégadonnées

Objectifs et contexte de la certification

Les compétences en data science s’exercent dans de nombreux domaines à enjeux économiques et sociétaux (marketing ; industrie ; agroalimentaire ; conseil ; recherche ; médical ; emploi....) et dans toute activité utilisant un volume important de données Le certificat doit permettre de connaitre les outils algorithmiques et techniques liés à la data science et de piloter un projet en data science. L’objectif de la certification est de fournir l’expertise nécessaire pour la gestion et l’analyse pointues des données massives. Le data scientist certifié pourra alors déterminer les indicateurs permettant de mettre en place une stratégie répondant à une problématique de l’entreprise.

OÙ SUIVRE CE DIPLÔME ?

GROUPE DES ECOLES NATIONALES D ECONOMIE ET STATISTIQUE

Non renseigné

Détails de la certification

Quelles sont les compétences que vous allez apprendre mais aussi comment l'examen va-t-il se passer ?

Compétences attestées :

Le Data Scientist est un expert de l'analyse de données massives ("big data"). Il a de bonnes connaissance de la gestion des bases de données, il récupère à partir de sources de données multiples et dispersées, structurées ou non, appartenant à l'entreprise ou en open data, les données dont il a besoin pour traiter le problème posé. Ses connaissances métier lui permettent de bien cibler la méthodologie adaptée au problème. Il est spécialisé en statistique, informatique et connait parfaitement le secteur ou la fonction d'application des données analysées. A ce titre, il est chargé de : 1) poser de façon claire et précise le problème à résoudre 2) récupérer les données permettant de résoudre ce problème. Les données peuvent venir des différents entrepôts de données de l'entreprise (les types de bases de données ne sont pas un problème pour lui). En fonction de la problématique, il peut aussi récupérer des données externes à l'entreprise (opendata, site web, Api dédiées, données INSEE…). 3) mettre en forme toutes les données de manière optimale en fonction des algorithmes utilisés 4) choisir les différentes méthodes potentielles pour apporter une solution. comparer les différentes méthodes en utilisant des données d'apprentissage (estimer les paramètres des méthodes) et des données de test (pour effectuer des prévisions) et avoir des indicateurs fiables de comparaison de méthodes en utilisant souvent des logiciels de traitements comme R ou Python. 5) rédiger des codes propres documentés et réutilisables par ses collègues dans un souci de répétabilité des analyses. 6) présenter de manière convaincante au donneur d'ordre les résultats lorsque la meilleure méthode est sélectionnée Le titulaire est capable de : 1) Requêter dans le système informatique de l'entreprise pour récupérer les données pertinentes 2) De récupérer les données adaptées à l'extérieur de l'entreprise en utilisant, si le besoin s'en fait sentir, des techniques d'acquisition automatisées de données externes à l'entreprises 3) D'écrire un programme pour analyser automatiquement de larges volumes de données et en extraire les informations pertinentes 4/ Mettre en œuvre les fonctions de R adaptées pour traiter et visualiser un jeu de données. 5) D'utiliser les algorithmes de machine learning implémentés dans R ou Python 6) De comparer différents algorithmes en utilisant des techniques d'apprentissage/validation 7) Selon le besoin, utiliser un serveur de calculs pour accélérer les temps de traitement. 8) Utiliser, pour un volume de données important, la bonne architecture de répartition des données. 9/ Evaluer la qualité du modèle selon sa finalité (prédictive ou explicative) 10) Présenter aux donneurs d'ordre son travail et ses choix. Utiliser avec intelligence des outils de visualisation ou créer un serveur web permettant de rejouer les méthodes. 11) Proposer aux services informatiques les modèles à mettre en production

Voies d'accès à la certification :

Voies d'accès Composition des Jurys
Après un parcours de formation sous statut d’élève ou d’étudiant
Non autorisé
En contrat d’apprentissage
Non autorisé
Après un parcours de formation continue
Non autorisé
En contrat de professionnalisation
Non autorisé
Par candidature individuelle
Non autorisé
Par expérience
Autorisé

Je cherche à faire...