Data Science avec Spark ML

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction au Big Data et à Apache Spark

  • Introduction au Big Data
  • Les challenges du Big Data
  • Notion de pipeline de Machine Learning
  • Présentation de Spark
  • Atouts de Spark
  • Ecosystème Spark
  • Spark sur Databricks vs Spark sur Hadoop
  • Spark Web UI
  • Utilisation de Spark Shell
  • Création d'un contexte Spark
  • Les exécuteurs Spark
  • Chargement d'un fichier en Shell
  • Réalisation d'opérations basiques sur un fichier avec Spark Shell
Exemple de travaux pratiques (à titre indicatif)
  • Mise en oeuvre de scripts Spark pour l'analyse de données et de Machine Learning

Jour 2

Spark Machine Learning

  • Rappels sur le Machine Learning
  • Machine Learning dans Spark
  • Spark ML API
  • DataFrames
  • Transformateurs et estimateurs
  • Construction, évaluation, et affichage de pipelines dans Spark
  • Travailler avec un pipeline
  • Sélection de modèles via une validation croisée
  • Les types supportés, les algorithmes et les utilitaires
  • Les types de données
  • Les fonctionnalités d'extraction et les statistiques basiques
Exemples de travaux pratiques (à titre indicatif)
  • Création de modèles et de pipelines de Machine Learning avec Spark
  • Démonstration de serving d'un modèle avec Neptune et/ou Databricks

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir suivi le cours

Public

Statisticiens, consultants Big Data, Data analysts, Data scientists.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

  • Gérer la programmation orientée objet
  • Manier le PHP Data Object (PDO) et les bases de données
  • Utiliser XML avec PHP
  • Utiliser PHP pour les services Web
  • Gérer la sécurité
  • Gérer les performances
  • Maîtriser l'environnement de développement
Tarif

A partir de 2 400,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre le fonctionnement et les usages de l’IA et de la data science.
  • Découvrir par la pratique les étapes d'un projet d’intelligence artificielle.
  • Identifier les différents acteurs, profils et compétences autour de l'IA et de la data science.
Tarif

A partir de 1 560,00 €

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Formation Stockage : Les fondamentaux

Proposé par PLB CONSULTANT

Objectifs de la formation

Plus concrètement, à l'issue de cette formation Stockage Fondamentaux vous aurez acquis les compétences et connaissances nécessaires pour:

  • Identifier les différents type de stockage et les accès au stockage (protocole)
  • Savoir comment protéger les données
  • Comprendre la terminologie, les enjeux, les problématiques et le futur du stockage

Ce stage est un bon prérequis à la Formation ONTAP 9 Cluster Administration et Data Protection (NOCD).

Tarif

A partir de 1 500,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Définir une stratégie Data Driven Marketing pertinente et génératrice de valeur
  • Sélectionner les outils adaptés (CRM, DMP, CDP)
  • Concevoir des campagnes et des programmes de marketing personnalisé et en mesurer l’efficacité et le ROI (tracking et KPI)
Tarif

A partir de 1 590,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance
  • Entreprise

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les avantages et contraintes technologiques, réglementaires, et organisationnelles d'un projet Big Data
  • Rédiger la charte d'un projet Big Data
  • Planifier un projet Big Data et choisir une méthodologie (Agile / traditionnelle / hybride)
  • Identifier les ressources du projet, et choisir une plateforme (On-Premise, Cloud, ou hybride, SaaS vs PaaS vs FaaS)
  • Exécuter un projet Big Data du développement au déploiement / monitoring
  • Adopter une démarche d'amélioration continue.
Tarif

A partir de 1 520,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Mettre en œuvre les interfaces, les collections et les génériques ;
  • Décrire les problématiques liées aux applications, l'intérêt d'appliquer une architecture en couches et les différentes façons d'implémenter les couches ;
  • Identifier le positionnement de la couche Business Objects, décrire ses responsabilités et les mettre en œuvre ;
  • Identifier le positionnement de la couche Data Access Layer, décrire ses responsabilités et les mettre en œuvre ;
  • Identifier le positionnement de la couche Business Objects Layer, décrire ses responsabilités et les mettre en œuvre ;
  • Implémenter la couche IHM avec l'API Swing ;
  • Décrire et implémenter les principes de la programmation événementielle ;
  • Décrire et mettre en œuvre l'architecture Modèle Vue Contrôleur ;
  • Implémenter le pattern Data Access Object.
Tarif

A partir de 990,00 €

Durée

37 heures

Modes
  • Distance

Objectifs de la formation

Maintenir la bonne performance d'un controleur NetApp. Savoir récolter les données de performance, les analyser pour détecter objectivement des goulots d'étranglements en écriture ou en lecture, et proposer des solutions pour les supprimer.

  • Terminologie et méthode d'analyse de la performance
  • Outils d'analyse et de surveillance de la performance
  • Architecture et flux de donnée avec Data OnTap
  • Etude de cas pour illustrer les goulots d'étranglement
  • Configurer le système en fonction des recommandations NetApp
  • Qualité de service (QoS) de DOT 8.3
  • Localiser les informations et ressources qui vous aiderons à optimiser les performances de vos controleurs
     
Tarif

A partir de 2 700,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...