Data Science avec Spark ML

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications et des pipelines de ML (Machine Learning) et d'IA (Intelligence Artificielle) sur Spark avec Python.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 1 520,00 €

Durée 2 jours  (14h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Jour 1

Introduction au Big Data et à Apache Spark

  • Introduction au Big Data
  • Les challenges du Big Data
  • Notion de pipeline de Machine Learning
  • Présentation de Spark
  • Atouts de Spark
  • Ecosystème Spark
  • Spark sur Databricks vs Spark sur Hadoop
  • Spark Web UI
  • Utilisation de Spark Shell
  • Création d'un contexte Spark
  • Les exécuteurs Spark
  • Chargement d'un fichier en Shell
  • Réalisation d'opérations basiques sur un fichier avec Spark Shell
Exemple de travaux pratiques (à titre indicatif)
  • Mise en oeuvre de scripts Spark pour l'analyse de données et de Machine Learning

Jour 2

Spark Machine Learning

  • Rappels sur le Machine Learning
  • Machine Learning dans Spark
  • Spark ML API
  • DataFrames
  • Transformateurs et estimateurs
  • Construction, évaluation, et affichage de pipelines dans Spark
  • Travailler avec un pipeline
  • Sélection de modèles via une validation croisée
  • Les types supportés, les algorithmes et les utilitaires
  • Les types de données
  • Les fonctionnalités d'extraction et les statistiques basiques
Exemples de travaux pratiques (à titre indicatif)
  • Création de modèles et de pipelines de Machine Learning avec Spark
  • Démonstration de serving d'un modèle avec Neptune et/ou Databricks

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir suivi le cours

Public

Statisticiens, consultants Big Data, Data analysts, Data scientists.

Ces formations pourraient vous intéresser

Objectifs de la formation

À l'issue de cette formation Fonctionnalités de SQL Server 2016 pour Big Data, vous aurez acquis les compétences et connaissances nécessaires pour:

  • Bien comprendre le Big Data
  • Maîtriser l'architecture de Polybase dans SQL Server 2016
  • Mettre en oeuvre l'exploitation et la configuration de Polybase
  • Savoir déterminer les composants Big Data présents dans Azure Feature Pack pour Integration Services
  • Savoir quand et comment utiliser les différents composants Big Data dans SQL Server Integration Services
  • Découvrir la Data Science
  • Savoir utiliser SQL Server R Services.
Tarif

A partir de 1 750,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation ONTAP 9.x. Administration Avancée NFS et SMB, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Savoir configurer et administrer NFS v3, v4, v4.1 et SMB 1, 2, 3 avec ONTAP 9
  • Analyse sur les performances et les dépannages pour les systèmes de stockage et les clients NFS et SMB
  • Cette formation prépare à l'examen NS0 163 de la certification Netapp Certified Data management Administrator (NCDA)
Tarif

A partir de 2 700,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Développer des applications de Machine Learning et d'IA (Intelligence Artificielle) avec Spark et Python
  • Utiliser la programmation parallèle sur un cluster
  • Développer et optimiser des algorithmes standards de Machine Learning et d'IA
  • Utiliser les bibliothèques Python pour le Machine Learning et d'IA
  • Décrire le cycle de vie d'un projet Data Science.
Tarif

A partir de 3 800,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser Scikitlearn pour créer des modèles d'apprentissage machine
  • Concevoir des expériences et interpréter les résultats des tests A/B
  • Visualiser l'analyse de clustering et de régression en Python à l'aide de Matplotlib
  • Produire des recommandations automatisées de produit ou de contenu avec des techniques de filtrage collaboratif
  • Appliquer les meilleures pratiques en matière de nettoyage et de préparation de vos données avant l'analyse.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les enjeux du Machine Learning dans l'entreprise
  • Utiliser les fonctionnalités de Machine Learning sous IBM Cognos Analytics CA 11.x
  • Manipuler les algorithmes de Machine Learning.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Créer des applications décisionnelles Qlik Sense permettant d'analyser des données provenant du monde du Big Data
  • Mettre en place une connexion de données Big Data Qlik Sense
  • Concevoir et modéliser un modèle de base de données Qlik Sense
  • Construire une interface de Data Visualisation sous Qlik Sense.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Identifier les responsabilités et compétences clés d'un Data Analyst
  • Comprendre les méthodes de collecte, de traitement et d'analyse des données
  • Connaître les outils et technologies couramment utilisés par les Data Analysts
Tarif

A partir de 700,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expliquer les tendances actuelles et futures de l'Intelligence Artificielle, sa mise en oeuvre et son impact sur les secteurs d'activité
  • Développer des compétences en matière de tests de modèles ML, en relevant des défis tels que la partialité et la transparence
  • Concevoir et exécuter des scénarios de test spécifiques à l'IA.
Tarif

A partir de 2 265,00 €

Durée

4j / 28h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Découvrir la Data Science et le métier de Data Scientist
  • Comprendre les concepts clés de la Data Science
  • Savoir utiliser les outils et méthodologies du Data Scientist
  • Pouvoir programmer en R ou en Python
  • Avoir des connaissances en machine learning
  • Gérer l'apprentissage supervisé, semi-supervisé et non-supervisé
  • Pouvoir intégrer la Data Science dans votre organisation
Tarif

A partir de 3 500,00 €

Durée

5 jours

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...