Formation - L'apprentissage Machine avec Spark (Spark ML)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche entreprise

Tarif

Contacter l'organisme

Durée 3 jours (21 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

IB Cegos


Formations aux technologies et métiers du Numérique
Voir la fiche

Tarif

Contacter l'organisme

Durée 3 jours (21 heures)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Programme

1 - L'écosystème SPARK et l'apprentissage Big Data

  • Enjeux machine learning et Big Data
  • L'écosystème Apache Spark
  • Les différentes briques de base
  • Focus SPARK SQL
  • Dataframes et Datasets
  • Lab : Mise en oeuvre de l'écosystème SPARK pour l'apprentissage machine Big Data

2 - Le chargement de données d'entraînement massives

  • Chargement générique de données
  • Chargement de fichiers de formats spécifiques
  • Interrogation de bases HIVE
  • Interrogation de bases externes
  • Lab : Chargement de données de sources diverses sur un cluster SPARK

3 - L'exploration de données d'entraînement massives

  • Réalisation de statistiques de base avec SPARK
  • Exploitation des librairies graphiques statistiques dans un cadre Big Data
  • Lab : Exploration de données d'entraînement sur un cas concret

4 - Le "Pipelining"

  • Le concept de Pipeline Spark
  • Les composants d'un Pipeline
  • Le fonctionnement d'un Pipeline
  • La gestion des paramètres
  • Persistance et chargement de Pipelines
  • Lab : Création d'un premier pipeline d'apprentissage machine avec SPARK

5 - Le prétraitement et l'ingénierie des variables prédictives

  • Extraction de variables prédictives
  • Transformation de variables
  • Sélection de variables prédictives
  • Hachage de variables
  • Lab : Prétraitement et ingénierie des variables prédictives sur un cas concret

6 - La création de modèles d'apprentissage Big Data

  • Classification de données massives
  • Régression de données massives
  • Clustering de données massives
  • Systèmes de recommandation Big Data
  • Règles d'association de données massives
  • Lab : Réalisation de modèles d'apprentissage sur des cas concrets Big Data

7 - L'optimisation du réglage des modèles d'apprentissage

  • Réglage des hyper-paramètres des modèles
  • Validation croisée
  • Séparation des données (entraînement, validation)
  • Lab : Optimisation du réglage de modèles d'apprentissage sur cas concrets

8 - Déploiement de modèles d'apprentissage Big Data

  • Création d'application prédictive en batch
  • Création d'application prédictive en streaming
  • Mise en oeuvre concrète sur un cluster Big Data
  • Bonnes pratiques de déploiement
  • Lab : Création d'applications en batch et en streaming sur cas concrets

Prérequis

Public

  • Chefs de projet et spécialistes big data souhaitant mettre en oeuvre Spark ML

Ces formations pourraient vous intéresser

Objectifs de la formation

À l'issue de cette formation Machine Learning avec Python, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Décrire les concepts du machine learning
  • Connaître les principaux algorithmes utilisés en machine learning
  • Utiliser la bibliothèque Scikit-Learn
  • Mettre en œuvre le regroupement de données automatique (clustering)
  • Utiliser Azure Machine Learning
Tarif

A partir de 2 490,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Concevoir et tester un modèle de ML (Machine Learning) avec MLflow
  • Concevoir et tester un pipeline MLOps robuste avec MLflow
  • Déployer votre modèle en production
  • Surveiller votre modèle de production et corriger les écarts.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Concevoir et tester un modèle de ML (Machine Learning) sur Google Cloud à partir d'un cas pratique fil rouge
  • Concevoir et tester un pipeline MLOps robuste
  • Déployer et automatiser votre pipeline MLOps de production et le passer à l'échelle
  • Surveiller votre modèle de production et corriger les écarts.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

  1. Prendre la parole avec aisance : Développer la confiance en s'exprimant librement en anglais.
  2. Mémoriser du vocabulaire à long terme : Acquérir et retenir un lexique varié et utile sur le long terme.
  3. Tenir une conversation en langue anglaise : Participer activement à des échanges verbaux en anglais.
  4. Prendre du plaisir à apprendre : Encourager une approche positive de l'apprentissage de la langue.
Tarif

A partir de 1 290,00 €

Durée

26j / 40h

Modes
  • Distance

Objectifs de la formation

  • Installer le serveur Web Apache sur différents systèmes d'exploitation.
  • Configurer le mode de fonctionnement d'Apache selon le système d'exploitation pour optimiser les performances.
  • Organiser la configuration dans les différents fichiers.
  • Réaliser la configuration de base d'Apache pour l'hébergement d'un site, et mettre en place une stratégie de délégation des tâches d'administration avec les fichiers .htaccess.
  • Configurer la journalisation des accès et des messages du serveur.
  • Gérer les permissions d'accès aux répertoires dans une démarche de sécurité optimale.
  • Mettre en place une stratégie de restriction d'accès par machine et par authentification utilisateur.
  • Gérer l'hébergement de multiples sites par la mise en place des hôtes virtuels.
  • Sécuriser les échanges entre les navigateurs et le serveur avec HTTPS.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Reconnaître les concepts, terminologies, spécificités et enjeux de l'IA moderne
  • Faire évoluer des produits existants pour y intégrer l'IA et identifier des nouveaux besoins
  • Développer et déployer des produits IA selon les meilleures méthodologies
  • Activer les leviers de maîtrise des coûts et de croissance et identifier les pièges.
Tarif

A partir de 1 700,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

Plus précisément à l’issue de cette formation Elasticsearch, Logstash et Kibana vous aurez acquis les connaissances et les compétences pour :

  • Comprendre les différents cas d’usages de la pile et les différentes facettes de l’offre proposée par la société Elastic
  • Savoir installer et configurer les différents produits de la suite
  • Savoir mettre au point des pipelines Logstash
  • Savoir mettre en place des index Elastic Search ou data streams. (settings, mappings, cycle de vie)
  • Comprendre toutes les possibilités de recherche offertes par le moteur ElasticSearch
  • Savoir mettre en place les tableaux de bords prédéfinis de la suite
  • Savoir mettre en place ces propres tableaux de bord dans Kibana
  • Sécuriser l’architecture et personnaliser l’interface utilisateur Kibana en fonction des rôles
  • Avoir une introduction au Machine Learning
Tarif

A partir de 1 890,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Kubeflow

Proposé par Sparks

Objectifs de la formation

  • Configurer un environnement Kubeflow
  • Connaître les options de déploiement
  • Construire et déployer un modèle de Machine Learning sur Kubeflow
  • Créer et exécuter un pipeline ML avec Kubeflow Pipelines
Tarif

A partir de 1 500,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • S'approprier les principes fondamentaux pour utiliser Docker (conteneurs, images, volumes...)
  • Connaître les spécificités de conteneurisation d'APIs
  • Gérer son propre hub de conteneurs
  • Déployer un pipeline data dans le Cloud
Tarif

A partir de 3 000,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les opérations basiques réalisées par la machine ;
  • Ecrire des algorithmes en pseudo-code ;
  • Identifier les cas d'usage des instructions conditionnelles et les utiliser ;
  • Identifier les cas d'usage des structures itératives et les utiliser ;
  • Identifier les cas d'usage des tableaux à une ou plusieurs dimensions, et les manipuler ;
  • Écrire des procédures et des fonctions, et les invoquer.
Tarif

A partir de 990,00 €

Durée

37 heures

Modes
  • Distance

Je cherche à faire...