Data Science avec Spark ML

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction au Big Data et à Apache Spark

  • Introduction au Big Data
  • Les challenges du Big Data
  • Notion de pipeline de Machine Learning
  • Présentation de Spark
  • Atouts de Spark
  • Ecosystème Spark
  • Spark sur Databricks vs Spark sur Hadoop
  • Spark Web UI
  • Utilisation de Spark Shell
  • Création d'un contexte Spark
  • Les exécuteurs Spark
  • Chargement d'un fichier en Shell
  • Réalisation d'opérations basiques sur un fichier avec Spark Shell
Exemple de travaux pratiques (à titre indicatif)
  • Mise en oeuvre de scripts Spark pour l'analyse de données et de Machine Learning

Jour 2

Spark Machine Learning

  • Rappels sur le Machine Learning
  • Machine Learning dans Spark
  • Spark ML API
  • DataFrames
  • Transformateurs et estimateurs
  • Construction, évaluation, et affichage de pipelines dans Spark
  • Travailler avec un pipeline
  • Sélection de modèles via une validation croisée
  • Les types supportés, les algorithmes et les utilitaires
  • Les types de données
  • Les fonctionnalités d'extraction et les statistiques basiques
Exemples de travaux pratiques (à titre indicatif)
  • Création de modèles et de pipelines de Machine Learning avec Spark
  • Démonstration de serving d'un modèle avec Neptune et/ou Databricks

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir suivi le cours

Public

Statisticiens, consultants Big Data, Data analysts, Data scientists.

Ces formations pourraient vous intéresser

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Concevoir et tester un modèle de ML (Machine Learning) sur Microsoft Azure
  • Concevoir et tester un pipeline MLOps robuste
  • Déployer et automatiser votre pipeline MLOps de production et le passer à l'échelle
  • Surveiller votre modèle de production et corriger les écarts.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire les concepts de la Data Discovery et de Tableau Desktop
  • Créer des visualisations (tableaux de bord interactifs, reporting...)
  • Mémoriser une méthodologie de mise en oeuvre des visualisations.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Formation Spring Data

Proposé par DAWAN

Objectifs de la formation

Intégrer différents modules Spring Data à  une application Java SE/EE
Tarif

A partir de 2 150,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Apache Spark

Proposé par DAWAN

Objectifs de la formation

- Développer des applications avec Spark - Utiliser les bibliothèques pour SQL, les flux de données et l'apprentissage automatique - Retranscrire des difficultés rencontrées sur le terrain dans des algorithmes parallèles - Développer des applications métier qui s'intègrent à  Spark
Tarif

A partir de 2 760,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Configurer le kit SDK AWS et utiliser les informations d'authentification des développeurs pour Java, C# / .NET, Python et JavaScript
  • Prendre en main le kit SDK AWS pour interagir avec les services AWS et développer des solutions logicielles
  • Intégrer la démarche pour mettre en oeuvre l'authentification du service
  • Utiliser Amazon Simple Storage Service et Amazon DynamoDB en tant que Data Stores
  • Intégrer des applications et données à l'aide de différents services (AWS Lambda, Amazon API Gateway, Amazon Simple Queue Service...)
  • Utiliser Amazon Cognito pour gérer l'authentification des utilisateurs
  • Utiliser des conteneurs dans le processus de développement
  • Déployer des applications sur AWS.
Tarif

A partir de 2 510,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Analyser, trier, traiter des données brutes pour les présenter sous forme de graphiques, de cartes ou d'organigrammes attrayants
  • Simplifier la lisibilité et accroître la compréhension.
Tarif

A partir de 1 240,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Réaliser des infographies
  • Créer des logos
  • Utiliser les outils de Data Visualisation
  • Mettre en page des documents publicitaires, de packaging ou de PLV (Publicité sur le Lieu de Vente)
  • Créer des effets de texte
  • Exporter vos créations vers les logiciels PAO
  • Améliorer votre efficacité dans votre workflow
  • Dessiner en perspective
  • Utiliser Illustrator pour générer du code CSS et SVG pour le Web Design.
Tarif

Contacter l'organisme

Durée

10j / 70h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les enjeux de la Data Science et de l'IA
  • Schématiser le cycle d'un projet Data Science
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse
  • Modéliser un problème de Data Science.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

Comprendre le Big Data et ses enjeux - Savoir déployer Hadoop et son écosystème - Comprendre HDFS, MapReduce - Structurer les données avec HBase - Ecrire des requêtes avec HiveQL
Tarif

A partir de 2 325,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

4 jours (28 heures)

Modes
  • Distance
  • Centre

Je cherche à faire...