Formation Data Science Fondamentaux

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Découvrir la Data Science et le métier de Data Scientist
  • Comprendre les concepts clés de la Data Science
  • Savoir utiliser les outils et méthodologies du Data Scientist
  • Pouvoir programmer en R ou en Python
  • Avoir des connaissances en machine learning
  • Gérer l'apprentissage supervisé, semi-supervisé et non-supervisé
  • Pouvoir intégrer la Data Science dans votre organisation

Sparks


Tout l'IT, vraiment tout
Voir la fiche entreprise

Tarif

A partir de 3 500,00 €

Durée 5 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Sparks


Tout l'IT, vraiment tout
Voir la fiche

Tarif

A partir de 3 500,00 €

Durée 5 jours
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

La Data Science est un pan du phénomène Big Data qui traite de l'analyse et de la visualisation des données entreprise pour les rendre exploitables dans une optique décisionnaire. Cette science a également donné lieu à la création d'un nouveau métier, data scientist, qui est en charge du traitement de ces données. Au travers de cette formation apportant les fondamentaux de la data science, vous apprendrez les principes clés ainsi que les méthodes principales de la data science. Vous maîtriserez également les bonnes pratiques de base pour le traitement et la visualisation des données. Grâce à notre formation en Data Science, vous aurez tous les outils pour intégrer la Data Science dans votre organisme !

Programme

Présentation de la Data Science

Big Data: définition, architecture…
La Big Data, quel enjeu pour les entreprises?
Volume, Vélocité, Variété: les 3V
Cas d’usage
Traiter les données: deep learning, analyse statistique…
Le Data Mining contre la Business Intelligence
Nouveaux challenges pour les organisations
Gouvernance des données

Principes, concepts clés de la Data Science

Data Science: présentation, définitions, vocabulaire et terminologie
Le métier de Data Scientist, « métier le plus sexy du XXIème siècle » ?
Data scientist: Rôle, responsabilités, compétences, philosophie
Objectifs et besoins
Processus de Data Science et Data Mining

Outils pour la Data Science

Outils propriétaires et outils open-source
Python et R: les langages pour la Data Science et leur environnement de développement
Notebooks Jupyter
Pandas, Numpy, SciKit-Learn… : les bibliothèques majeures
SQL, NoSQL, MongoDB : les principales bases de données pour la Data Science
Utiliser Excel, Tableau, D3.js ou encore Matplotlib pour visualiser les données
Installation d’outils pour les cas pratiques

Rappels mathématiques

Programmer avec Python et R

Python, R: les langages de la Data Science
Caractéristiques, structure
Opérations basiques, données, assignation de variables
Fonctions, listes, tableaux et packages

Obtenir et explorer les données

Trouver et importer des données
Données publiques, données privées
Entreposer les données (datawarehouse et datalake…)
Installation de bibliothèques et de packages
Pertinence des données: identification des caractéristiques des données
Contrôle de qualité: les bonnes pratiques

Prétraitement des données

De l’importance de nettoyer les données
Exemple d’un ensemble de données non-structurées
Nettoyage et préparation d’ensembles de données
Identification et résolution des valeurs manquantes, des valeurs « aberrantes »
Apache Spark et Apache Hadoop, MapReduce pour le Big Data
L’analyse en composantes principales (ACP, ou PCA pour Principal Component Analysis)
Extraire et sélectionner des features (Feature engineering)

Machine Learning pour analyser et modéliser

Entrées et sorties pour la modélisation d’un problème de Data Science
Machine Learning: capacités
Algorithmes supervisés, non-supervisés, semi-supervisés
Classification, régression d’algorithmes
Machine Learning et intuition
SciKit-Learn, gradDescent, TensorFlow… : les bibliothèques Machine Learning
Text Mining
Gestion des volumes du Big Data

Apprentissage supervisé: les méthodes

Construction d’un modèle de régression linéaire pour estimer les valeurs
Régression non-linéaire, logistique
Interpréter les coefficients de régression
Descente de gradient
Labels de jeux de données: automatisation
Méthodes ensemblistes
Forêts aléatoires, arbres de décision
SVM (machines à vecteurs de support)
Réseaux Bayésiens
Classification naïve bayésienne

Apprentissage semi-supervisé, non-supervisé, clustering

Algorithmes majeurs
Partitionnement en k-moyennes
Regroupement hiérarchique
Clustering basé sur la densité
Réseaux de neurones (Deep Learning)

Modèles d’apprentissage: évaluation et tests

Sur-apprentissage et cross-validation pour l’amélioration des modèles
Maintenance des modèles
Détérioration de la performance des modèles d’apprentissage
Ajustement, validation d’un modèle

Visualisation et restitution des données

Prendre des décisions à partir des données
Visualiser les données: les grands principes
Utiliser Tableau Software ou encore QlikSense pour la datavisualization
Raconter une histoire avec les données avec le Data storytelling

Intégrer la Data Science dans votre organisation

Implémentations dans les processus actuels
Considérer les objectifs et le contexte professionnel pour le choix des outils
Enjeux organisationnels, éthiques et juridiques

Prérequis

Connaissances en statistiques et en programmation

Public

Managers,

Ces formations pourraient vous intéresser

Objectifs de la formation

This course presents advanced models to predict categorical and continuous targets. Before reviewing the models, data preparation issues are addressed such as partitioning, detecting anomalies, and balancing data. The participant is first introduced to a technique named PCA/Factor, to reduce the number of fields to a number of core fields, referred to as components or factors.

The next units focus on supervised models, including Decision List, Support Vector Machines, Random Trees, and XGBoost. Methods are reviewed to combine supervised models and execute them in a single run, both for categorical and continuous targets.

Tarif

A partir de 720,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Représenter des données sous forme graphique et interactive
  • Exploiter les bibliothèques de codes prêts à l'emploi de D3.js
  • Distinguer les interactions entre HTML 5, SVG, CSS 3, JavaScript.
Tarif

A partir de 2 070,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Ingérer, nettoyer et transformer des données
  • Modéliser des données pour la performance et l'évolutivité
  • Concevoir et créer des rapports pour l'analyse des données
  • Appliquer et exécuter des analyses de rapports avancées
  • Gérer et partager les ressources des rapports
  • Accéder aux données et les traiter à partir d'une série de sources de données, y compris les données relationnelles et non relationnelles
  • Mettre en oeuvre des normes et des politiques de sécurité appropriées dans tout le spectre de Power BI, y compris les ensembles et les groupes de données
  • Gérer et déployer des rapports et des tableaux de bord pour le partage et la distribution de contenu.
Tarif

A partir de 2 130,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

Cette formation Implémenter Data Warehouse SQL Server 2016/2019, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre les concepts d'entrepôts de données
  • Découvrir comment concevoir et implémenter un entrepôt de données
  • Apprendre à concevoir et implémenter des packages SSIS
  • Être en mesure d'implémenter le chargement d'un entrepôt de données avec SSIS
  • Disposer des compétences nécessaires à l'hébergement d'un Data Warehouse dans le cloud Azure
Tarif

A partir de 3 025,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Découvrir et utiliser la puissance prédictive des modèles ensemblistes
  • Savoir effectuer un "feature engineering" performant
  • Appréhender les techniques de text-mining et de deep-learning à travers d'exemples concrets
  • Enrichir ses outils de data scientist
Tarif

A partir de 2 500,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation BigQuery vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Décrire les principes de base de l’architecture BigQuery
  • Implémenter des modèles de conception de stockage et de schéma pour améliorer les performances
  • Utiliser DML et planifier des transferts de données pour ingérer des données
  • Appliquer les meilleures pratiques pour améliorer l’efficacité de la lecture et optimiser les performances des requêtes
  • Gérer la capacité et automatiser les charges de travail
  • Comprendre les modèles par rapport aux anti-modèles pour optimiser les requêtes et améliorer les performances de lecture
  • Utiliser des outils de journalisation et de surveillance pour comprendre et optimiser les modèles d’utilisation
  • Appliquer les meilleures pratiques de sécurité pour gérer les données et les ressources
  • Créer et déployer plusieurs catégories de modèles de machine learning avec BigQuery ML
Tarif

A partir de 2 100,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l’issue de cette formation Spring Cloud Stream et Kafka, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Mettre en place l'environnement de développement Spring Cloud Data Stream
  • Concevoir une architecture microservices basée sur Kafka et Spring Cloud
  • Adopter une programmation fonctionnelle
  • Mettre en place une topologie de processeurs Kafka avec SpringBoot
  • Surveiller et récolter les métriques d’une telle architecture
Tarif

A partir de 1 480,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire la palette des métiers de la Data et leurs spécificités
  • Dimensionner et structurer une équipe de talents de la Data
  • Utiliser les clés pour optimiser l'efficacité de ces talents dans l'entreprise.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation Concept et architecture des systèmes d'information décisionnels vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre les apports d'un Datawarehouse pour l'entreprise
  • Décrire les différentes phases dans un projet de mise en oeuvre de Data Warehouse
  • Identifier les outils au sein d'un projet de Business Intelligence (ETL, Reporting, etc.)
  • Comprendre le vocabulaire et le formalisme de la modélisation (faits, dimensions, agrégats, étoiles, etc.)
  • Réaliser un modèle en étoile
  • Prendre en compte les contraintes de volumétrie
Tarif

A partir de 1 600,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre l'IA, l'automatisation et les systèmes cognitifs
  • Savoir gérer les données numériques avec la Data Science
  • Connaître les mécanismes et technologies de l'IA
  • Appréhender l'impact de l'IA sur l'économie et les sociétés
  • Pouvoir implémenter un projet basé sur l'IA dans votre entreprise
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...