Pour offrir les meilleures expériences possibles, nous utilisons des technologies telles que les cookies pour stocker et/ou accéder aux informations des appareils.
Le fait de ne pas consentir ou de retirer son consentement peut avoir un effet négatif sur certaines caractéristiques et fonctions.
Voir notre Politique de protection des données pour plus d'informations.
Tarif |
A partir de 3 500,00 € |
Durée | 5 jours |
Modes |
|
Sessions | |
Lieux | Partout en France |
Tarif |
A partir de 3 500,00 € |
Durée | 5 jours |
Modes |
|
Sessions | |
Lieux | Partout en France |
La Data Science est un pan du phénomène Big Data qui traite de l'analyse et de la visualisation des données entreprise pour les rendre exploitables dans une optique décisionnaire. Cette science a également donné lieu à la création d'un nouveau métier, data scientist, qui est en charge du traitement de ces données. Au travers de cette formation apportant les fondamentaux de la data science, vous apprendrez les principes clés ainsi que les méthodes principales de la data science. Vous maîtriserez également les bonnes pratiques de base pour le traitement et la visualisation des données. Grâce à notre formation en Data Science, vous aurez tous les outils pour intégrer la Data Science dans votre organisme !
Big Data: définition, architecture…
La Big Data, quel enjeu pour les entreprises?
Volume, Vélocité, Variété: les 3V
Cas d’usage
Traiter les données: deep learning, analyse statistique…
Le Data Mining contre la Business Intelligence
Nouveaux challenges pour les organisations
Gouvernance des données
Data Science: présentation, définitions, vocabulaire et terminologie
Le métier de Data Scientist, « métier le plus sexy du XXIème siècle » ?
Data scientist: Rôle, responsabilités, compétences, philosophie
Objectifs et besoins
Processus de Data Science et Data Mining
Outils propriétaires et outils open-source
Python et R: les langages pour la Data Science et leur environnement de développement
Notebooks Jupyter
Pandas, Numpy, SciKit-Learn… : les bibliothèques majeures
SQL, NoSQL, MongoDB : les principales bases de données pour la Data Science
Utiliser Excel, Tableau, D3.js ou encore Matplotlib pour visualiser les données
Installation d’outils pour les cas pratiques
Python, R: les langages de la Data Science
Caractéristiques, structure
Opérations basiques, données, assignation de variables
Fonctions, listes, tableaux et packages
Trouver et importer des données
Données publiques, données privées
Entreposer les données (datawarehouse et datalake…)
Installation de bibliothèques et de packages
Pertinence des données: identification des caractéristiques des données
Contrôle de qualité: les bonnes pratiques
De l’importance de nettoyer les données
Exemple d’un ensemble de données non-structurées
Nettoyage et préparation d’ensembles de données
Identification et résolution des valeurs manquantes, des valeurs « aberrantes »
Apache Spark et Apache Hadoop, MapReduce pour le Big Data
L’analyse en composantes principales (ACP, ou PCA pour Principal Component Analysis)
Extraire et sélectionner des features (Feature engineering)
Entrées et sorties pour la modélisation d’un problème de Data Science
Machine Learning: capacités
Algorithmes supervisés, non-supervisés, semi-supervisés
Classification, régression d’algorithmes
Machine Learning et intuition
SciKit-Learn, gradDescent, TensorFlow… : les bibliothèques Machine Learning
Text Mining
Gestion des volumes du Big Data
Construction d’un modèle de régression linéaire pour estimer les valeurs
Régression non-linéaire, logistique
Interpréter les coefficients de régression
Descente de gradient
Labels de jeux de données: automatisation
Méthodes ensemblistes
Forêts aléatoires, arbres de décision
SVM (machines à vecteurs de support)
Réseaux Bayésiens
Classification naïve bayésienne
Algorithmes majeurs
Partitionnement en k-moyennes
Regroupement hiérarchique
Clustering basé sur la densité
Réseaux de neurones (Deep Learning)
Sur-apprentissage et cross-validation pour l’amélioration des modèles
Maintenance des modèles
Détérioration de la performance des modèles d’apprentissage
Ajustement, validation d’un modèle
Prendre des décisions à partir des données
Visualiser les données: les grands principes
Utiliser Tableau Software ou encore QlikSense pour la datavisualization
Raconter une histoire avec les données avec le Data storytelling
Implémentations dans les processus actuels
Considérer les objectifs et le contexte professionnel pour le choix des outils
Enjeux organisationnels, éthiques et juridiques
Tarif |
A partir de 700,00 € |
Durée |
1 jour |
Modes |
|
Tarif |
Contacter l'organisme |
Durée |
4 jours (28 heures) |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
Contacter l'organisme |
Durée |
3j / 21h |
Modes |
|
Tarif |
A partir de 4 650,00 € |
Durée |
3j / 21h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
Contacter l'organisme |
Durée |
2j / 14h |
Modes |
|
Tarif |
A partir de 800,00 € |
Durée |
1 jour |
Modes |
|
Tarif |
A partir de 3 500,00 € |
Durée |
5 jours |
Modes |
|
Tarif |
A partir de 2 275,00 € |
Durée |
3j / 21h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
Contacter l'organisme |
Durée |
1j / 7h |
Modes |
|
A l'issue de cette formation, vous serez capable de :
Tarif |
A partir de 1 520,00 € |
Durée |
2j / 14h |
Modes |
|