Formation Le rôle du Data Scientist
Cette formation d'une journée est destinée aux professionnels souhaitant se familiariser avec le rôle et les responsabilités d'un Data Scientist. Les apprenants découvriront les concepts fondamentaux de la science des données, les rôles stratégiques et défis du métier, ainsi que les outils et technologies couramment utilisés par un Data Scientist.
Public admis
- Salarié en Poste
- Entreprise
Demandeur d'emploi et Etudiant non admis
Financement
- Votre OPCO
- Financement personnel
Financement CPF non pris en charge
Modalités
- En centre
- En entreprise
- À distance
Objectifs pédagogiques
- Identifier les principales tâches et responsabilités d'un Data Scientist
- Comprendre les concepts fondamentaux de la science des données (exploration, préparation des données, modèles d'apprentissage automatique)
- Connaître les outils et technologies couramment utilisés par un Data Scientist
Programme de la formation
Introduction à la formation d’acculturation au rôle de Data Scientist
Présentation du rôle stratégique du Data Scientist
Évolution du domaine des sciences de données
Principaux défis et opportunités actuels
Différences entre Data Engineer, Data Scientist et Data Analyst
Vue d’ensemble des compétences requises
Concepts fondamentaux de la Science des Données
Exploration et visualisation des données
Techniques de nettoyage et de préparation des données
Concepts statistiques essentiels
Introduction aux modèles d’apprentissage automatique : types de modèles, sélection et ajustement, validation croisée et hyperparamétrage
Tâches Typiques du Data Scientist
Collecte et exploration de données venant de différentes sources
Nettoyage et préparation des données pour garantir leur qualité
Sélection de modèles adaptés aux problématiques spécifiques
Évaluation des performances des modèles et optimisation
Communication des résultats aux non-spécialistes
Panorama des outils et technologies couramment utilisés
Environnements de Développement Intégrés (IDE) : Jupyter Notebooks, Anaconda
Langages de Programmation : Python, R, langages spécialisés (SQL, Scala)
Bibliothèques de Traitement de Données : Pandas, Numpy, Apache Spark
Bibliothèques d’Apprentissage Automatique : Scikit-Learn, TensorFlow, PyTorch, XGBoost et LightGBM
Outils de Visualisation : Matplotlib, Seaborn, Power BO, D3.js

Proposé par
Sparks
"Tout l'IT, vraiment tout"

Proposé par
Sparks
