Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
À l'issue de cette formation Industrialisation Data Science, vous aurez acquis les connaissances et compétences nécessaires pour :
Tarif |
A partir de 3 825,00 € |
Durée | 5 jours (35h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
Tarif |
A partir de 3 825,00 € |
Durée | 5 jours (35h) |
Modes |
|
Sessions | |
Lieux | Partout en France |
L'industrialisation d'un projet de Data Science se heurte souvent à de nombreux obstacles. Qu'ils soient budgétaires, organisationnels ou techniques, ces blocages témoignent de la difficulté à dépasser le stade des POCs (Proof of Concept). Cela est particulièrement vrai dans le domaine technique, où les freins au niveau du code et de la chaîne de traitement des données peuvent être légion. Il est donc nécessaire que le data scientist en fonction puisse mettre en œuvre toutes les méthodes lui permettant de récupérer, nettoyer, explorer, et modéliser ses données, avant le déploiement et la mise en production.
Dans un premier temps, cette formation Industrialisation Data Science commence par vous fournir les meilleures pratiques pour faire passer votre projet du stade de la recherche à celui de l'exploitation. Grâce à ces bonnes pratiques de développement, vos applications de data science seront ainsi en mesure d'apporter de la valeur en entreprise.
Une fois que le code du projet de Data Science a été industrialisé, il reste encore un certain nombre d’étapes pour industrialiser le système au complet. Il s’agira notamment de mettre en place un mécanisme d’orchestration, mais aussi d’être capable de déployer régulièrement, et de suivre le comportement du système.
Dans un second temps, ce cours Industrialisation Data Science vous propose de découvrir les systèmes de Data Science industrialisés, et vous fait pratiquer les meilleures méthodes pour faire passer votre projet en production.
ATTENTION, ce cours est constitué de deux modules distincts, les dates renseignées sont celles du premier module. Contactez notre service commercial pour connaitre les dates du second module.
Jour 1
Rôle du data scientist
Convictions
Jupyter Notebook
PyCharm
Environnement anaconda
Nettoyer son notebook
Noms des variables
Utilisation de fichiers de configuration
Programmation fonctionnelle
Immutabilité
Créer des fonctions
Mise en pratique
Appliquer les techniques de Clean code à un notebook
Découverte du TDD
Initiation à unittest :
- Les classes de test
- Écrire son premier test
- Les méthode setup et teardown
Intégration à setuptools
Mise en pratique
Écrire ses premiers tests
Jour 2
Découverte de Sphinx
Découverte de sphinx-quickstart
Mise en pratique
Documenter son projet
Introduction à git
Gérer les versions de code
Utilisation des tags
Stratégies de versionning
Gérer des datasets et des modèles
Définition du packaging
Introduction à setuptools
Installer son code en local
Gestion des dépendances
Règles simples de démarrage
Mise en pratique
Créer et installer son package
Jour 3
Les différents environnements nécessaires
L’intérêt de l’intégration continue et du déploiement continu
Les outils de CI / CD existants
Mise en pratique
Mettre en place un outil d’intégration continue
Description des différents types de tests
Focus sur les tests d’intégrations et fonctionnels
Présentation de framework de tests
Introduction au cloud et aux différents providers
Choix d’un cloud provider pour les travaux pratiques
Le besoin d’orchestration dans un système de Data Science
Présentation de différents orchestrateurs
Mise en pratique
Passer d’un script Python à une série de tâches orchestrées avec Airflow
Jour 4
Patterns d’architecture technique pour favoriser la mise en production et la maintenabilité du projet
Identification des artefacts (modèles, données, code…)
Cycles de vie des artefacts
La démarche
Infrastructure as code
Méthodes pour exposer un modèle de Data Science
Mise en pratique
Interagir avec un modèle existant
Jour 5
Mise en pratique
Passer d’un modèle one-shot à un modèle qui prédit toutes les secondes
À partir d’un flux de données disponibles, mettre en place les outils nécessaires pour faire une prédiction par seconde
L’intérêt des boucles de feedback
Identifier les différentes boucles de feedbacks
Mettre en place les différentes boucles de feedbacks
L’enjeu du monitoring
Les indicateurs à suivre
Les pratiques pour mettre en place un monitoring utile tout en respectant les contraintes de SLA
Choisir le bon moment pour réentraîner un modèle
Les stratégies à mettre en place pour s’assurer que le modèle en production est toujours pertinent
Partage et retour d’expérience
Questions / réponses
Évaluation de la session
Concrètement, à l'issue de cette formation AIX Administration système III, vous aurez acquis les connaissances et compétences nécessaires pour :
Tarif |
A partir de 3 990,00 € |
Durée |
5j / 35h |
Modes |
|
Tarif |
A partir de 6 495,00 € |
Durée |
91h de synchrone + 5h d'e-learning + travail personnel pour les évaluations |
Modes |
|
À l'issue de cette formation Animer un atelier collaboratif vous aurez acquis les connaissances et les compétences nécessaires pour :
Tarif |
Contacter l'organisme |
Durée |
1j / 7h |
Modes |
|
Tarif |
A partir de 925,00 € |
Durée |
1 jour |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
2j / 14h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
A partir de 1 100,00 € |
Durée |
2j / 14h |
Modes |
|
Tarif |
A partir de 1 535,00 € |
Durée |
2 jours |
Modes |
|
Tarif |
A partir de 1 390,00 € |
Durée |
2j / 14h |
Modes |
|
Tarif |
A partir de 559,00 € |
Durée |
1j / 9h |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
3 jours (21 heures) |
Modes |
|