J'ai un diplôme "Expert en infrastructures de données massives"

Je sais faire les actions suivantes :

Encadrer la conception d’un projet data au sein d’une organisation Coordonner la réalisation d’un projet data au sein d’une organisation Programmer la collecte de données depuis plusieurs sources pour un projet data au sein d’une organisation Développer la mise à disposition technique des données collectées pour un projet data au sein d’une organisation Mettre en place l’entrepôt de données Assurer la maintenance et l'évolution de l’entrepôt de données Mettre en place un data-lake Assurer la gestion de l’accès aux données

OÙ SUIVRE CE DIPLÔME ?

SIMPLON.CO

Non renseigné

Détails du diplôme

Quelles sont les compétences que vous allez apprendre mais aussi comment l'examen va-t-il se passer ?

Compétences attestées :

Analyser l’expression d’un besoin de projet data dans une étude de faisabilité en explorant, à l’aune des enjeux stratégiques de l’organisation, le besoin métier avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques du projet avec le ou les commanditaire(s). Cartographier les données disponibles en référençant les usages, les sources, les métadonnées et les données afin de valider les hypothèses techniques du projet data. Concevoir un cadre technique d’exploitation des données en analysant les contraintes techniques, de moyens et la cartographie des données afin de définir une réponse technique adaptée aux ressources mobilisables dans le respect du RGPD et d’une démarche éco-responsable. Réaliser une veille technique et réglementaire en sélectionnant des sources et en collectant et traitant les informations collectées afin de formuler des recommandations projet toujours en phase avec l’état de l’art. Planifier la réalisation d’un projet data en attribuant les moyens nécessaires et en définissant les étapes de réalisation et les méthodes de suivi du projet afin de d’organiser sa mise en oeuvre Superviser la réalisation d’un projet data en organisant les méthodes, les outils de travail et la communication entre les parties prenantes, afin d’accompagner les membres de l’équipe dans la réussite du projet Communiquer tout au long de la réalisation du projet data sur les orientations, les réalisations et leurs impacts en élaborant la stratégie et les supports de communication afin d’informer toutes les parties prenantes des évolutions ou des opportunités internes comme externes, portés par le projet. Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet. Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet. Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final. Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet. Partager le jeu de données en configurant des interfaces logicielles et en créant des interfaces programmables afin de mettre à disposition le jeu de données pour le développement du projet. Modéliser la structure des données d’un entrepôt de données en s’appuyant sur les dimensions et les faits afin d’optimiser l’organisation des données pour les requêtes analytiques. Créer un entrepôt de données à partir des paramètres du projet, des contraintes techniques et matérielles et de la modélisation de la structure des données afin de soutenir l’analyse de l’activité et l’aide à la décision stratégique de l’organisation Intégrer les ETL nécessaires en entrée et en sortie d’un entrepôt de données afin de garantir la qualité et le bon formatage des données en respectant les modélisations logiques et physiques préalablement établies Gérer l’entrepôt de données à l’aide des outils d’administration et de supervision dans le respect du RGPD, afin de garantir les bons accès, l’intégration des évolutions structurelles et son maintien en condition opérationnelle dans le temps. Implémenter des variations dans les dimensions de l’entrepôt de données en appliquant la méthode adaptée en fonction du type de changement demandé afin d’historiser les évolutions de l’activité de l’organisation et maintenir ainsi une bonne capacité d’analyse.

Voies d'accès à la certification :

Voies d'accès Composition des Jurys
Après un parcours de formation sous statut d’élève ou d’étudiant
Autorisé
Le jury de certification est composé : * d’au moins deux professionnels avec une expérience avérée de 2 ans dans le secteur de la gestion et du traitement des données. L’un d’entre eux a spécifiquement une expérience de Data Engineer, Data Miner ou encore Développeur Data ; * la ou les personnes supplémentaires peuvent être un ou des professionnels qui maîtrisent les pratiques de recrutement en entreprise. Au moins 50% des jurés sont extérieurs à l’organisme certificateur et à l’organisme évaluateur. Les membres du jury ne doivent pas entretenir, ou avoir entretenu, un lien professionnel ou personnel avec le candidat. Ils ne doivent pas non plus avoir participé au processus de formation ou à la préparation du candidat à la certification.
En contrat d’apprentissage
Autorisé
Le jury de certification est composé : * d’au moins deux professionnels avec une expérience avérée de 2 ans dans le secteur de la gestion et du traitement des données. L’un d’entre eux a spécifiquement une expérience de Data Engineer, Data Miner ou encore Développeur Data ; * la ou les personnes supplémentaires peuvent être un ou des professionnels qui maîtrisent les pratiques de recrutement en entreprise. Au moins 50% des jurés sont extérieurs à l’organisme certificateur et à l’organisme évaluateur. Les membres du jury ne doivent pas entretenir, ou avoir entretenu, un lien professionnel ou personnel avec le candidat. Ils ne doivent pas non plus avoir participé au processus de formation ou à la préparation du candidat à la certification.
Après un parcours de formation continue
Autorisé
Le jury de certification est composé : * d’au moins deux professionnels avec une expérience avérée de 2 ans dans le secteur de la gestion et du traitement des données. L’un d’entre eux a spécifiquement une expérience de Data Engineer, Data Miner ou encore Développeur Data ; * la ou les personnes supplémentaires peuvent être un ou des professionnels qui maîtrisent les pratiques de recrutement en entreprise. Au moins 50% des jurés sont extérieurs à l’organisme certificateur et à l’organisme évaluateur. Les membres du jury ne doivent pas entretenir, ou avoir entretenu, un lien professionnel ou personnel avec le candidat. Ils ne doivent pas non plus avoir participé au processus de formation ou à la préparation du candidat à la certification.
En contrat de professionnalisation
Autorisé
Le jury de certification est composé : * d’au moins deux professionnels avec une expérience avérée de 2 ans dans le secteur de la gestion et du traitement des données. L’un d’entre eux a spécifiquement une expérience de Data Engineer, Data Miner ou encore Développeur Data ; * la ou les personnes supplémentaires peuvent être un ou des professionnels qui maîtrisent les pratiques de recrutement en entreprise. Au moins 50% des jurés sont extérieurs à l’organisme certificateur et à l’organisme évaluateur. Les membres du jury ne doivent pas entretenir, ou avoir entretenu, un lien professionnel ou personnel avec le candidat. Ils ne doivent pas non plus avoir participé au processus de formation ou à la préparation du candidat à la certification.
Par candidature individuelle
Non autorisé
Par expérience
Autorisé
Le jury de certification est composé : * d’au moins deux professionnels avec une expérience avérée de 2 ans dans le secteur de la gestion et du traitement des données. L’un d’entre eux a spécifiquement une expérience de Data Engineer, Data Miner ou encore Développeur Data ; * la ou les personnes supplémentaires peuvent être un ou des professionnels qui maîtrisent les pratiques de recrutement en entreprise. Au moins 50% des jurés sont extérieurs à l’organisme certificateur et à l’organisme évaluateur. Les membres du jury ne doivent pas entretenir, ou avoir entretenu, un lien professionnel ou personnel avec le candidat. Ils ne doivent pas non plus avoir participé au processus de formation ou à la préparation du candidat à la certification.

Segmentation de la certification

Cette certification se compose de 4 Blocs de compétences

Les modalités d'acquisition de la certification par capitalisation des blocs de compétences et/ou par équivalence sont définies par chaque certificateur accrédité qui met en œuvre les dispositifs qu’il juge adaptés. Ces modalités peuvent être modulées en fonction du chemin d’accès à la certification : formation initiale, VAE, formation continue.

RNCP37638BC01 - Piloter la conduite d’un projet data au sein d’une organisation

    Analyser l’expression d’un besoin de projet data dans une étude de faisabilité en explorant, à l’aune des enjeux stratégiques de l’organisation, le besoin métier avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques du projet avec le ou les commanditaire(s). Cartographier les données disponibles en référençant les usages, les sources, les métadonnées et les données afin de valider les hypothèses techniques du projet data. Concevoir un cadre technique d’exploitation des données en analysant les contraintes techniques, de moyens et la cartographie des données afin de définir une réponse technique adaptée aux ressources mobilisables dans le respect du RGPD et d’une démarche éco-responsable. Réaliser une veille technique et réglementaire en sélectionnant des sources et en collectant et traitant les informations collectées afin de formuler des recommandations projet toujours en phase avec l’état de l’art. Planifier la réalisation d’un projet data en attribuant les moyens nécessaires et en définissant les étapes de réalisation et les méthodes de suivi du projet afin de d’organiser sa mise en oeuvre Superviser la réalisation d’un projet data en organisant les méthodes, les outils de travail et la communication entre les parties prenantes, afin d’accompagner les membres de l’équipe dans la réussite du projet Communiquer tout au long de la réalisation du projet data sur les orientations, les réalisations et leurs impacts en élaborant la stratégie et les supports de communication afin d’informer toutes les parties prenantes des évolutions ou des opportunités internes comme externes, portés par le projet.

RNCP37638BC02 - Réaliser la collecte, le stockage et la mise à disposition des données d’un projet data au sein d’une organisation

    Automatiser l’extraction de données depuis un service web, une page web (scraping), un fichier de données, une base de données et un système big data en programmant le script adapté afin de pérenniser la collecte des données nécessaires au projet. Développer des requêtes de type SQL d’extraction des données depuis un système de gestion de base de données et un système big data en appliquant le langage de requête propre au système afin de préparer la collecte des données nécessaires au projet. Développer des règles d'agrégation de données issues de différentes sources en programmant, sous forme de script, la suppression des entrées corrompues et en programmant l’homogénéisation des formats des données afin de préparer le stockage du jeu de données final. Créer une base de données dans le respect du RGPD en élaborant les modèles conceptuels et physiques des données à partir des données préparées et en programmant leur import afin de stocker le jeu de données du projet. Partager le jeu de données en configurant des interfaces logicielles et en créant des interfaces programmables afin de mettre à disposition le jeu de données pour le développement du projet.

RNCP37638BC03 - Elaborer et maintenir un entrepôt de données (data warehouse)

    Modéliser la structure des données d’un entrepôt de données en s’appuyant sur les dimensions et les faits afin d’optimiser l’organisation des données pour les requêtes analytiques. Créer un entrepôt de données à partir des paramètres du projet, des contraintes techniques et matérielles et de la modélisation de la structure des données afin de soutenir l’analyse de l’activité et l’aide à la décision stratégique de l’organisation. Intégrer les ETL nécessaires en entrée et en sortie d’un entrepôt de données afin de garantir la qualité et le bon formatage des données en respectant les modélisations logiques et physiques préalablement établies. Gérer l’entrepôt de données à l’aide des outils d’administration et de supervision dans le respect du RGPD, afin de garantir les bons accès, l’intégration des évolutions structurelles et son maintien en condition opérationnelle dans le temps. Implémenter des variations dans les dimensions de l’entrepôt de données en appliquant la méthode adaptée en fonction du type de changement demandé afin d’historiser les évolutions de l’activité de l’organisation et maintenir ainsi une bonne capacité d’analyse.

RNCP37638BC04 - Encadrer la collecte massive et la mise à disposition des données issues de l’activité de l’organisation grâce à un data lake

    Concevoir l'architecture du data lake en sélectionnant les technologies appropriées en fonction de la volumétrie, de la variété et de la vitesse des données dans le but de définir l’architecture technique optimale à intégrer. Intégrer les différents composants d'infrastructure du data lake en appliquant la procédure adaptée, afin d’assurer l’acquisition, le stockage et la mise à disposition du catalogue de données Gérer le catalogue des données en tenant compte de leur nature, de leurs sources d’alimentation et de leur cycle de vie, dans le respect du RGPD, afin de garantir les fonctionnalités du service. Implémenter les règles de gouvernance des données en sécurisant la recherche, la récupération et l’ajout de données afin de respecter les règles de gouvernance des données de l’organisation, dans le cadre du déploiement de la politique de protection des données.

Je cherche à faire...