Spark en Python : analyse de données et machine learning

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre le principe de fonctionnement d’Apache Spark
  • Utiliser PySpark pour manipuler des données avec Python
  • Traiter les flux de données en temps réel avec Spark Streaming

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche entreprise

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

Description

Cette formation en Big Data présente le framework Spark de calcul distribué. Vous écrirez les tâches avec le langage Python en utilisant la bibliothèque PySpark. Vous utiliserez la bibliothèque Machine Learning MLlib ainsi que les technologies Spark SQL, Spark Streaming.

Programme

Introduction au big data
Environnements big data : Hadoop, Mapreduce, Spark, etc.
Découvrir l’environnement Spark
Utilisation Spark : Quels avantages ?
Comment installer Apache Spark
Quelle infrastructure pour utiliser Spark en entreprise ?
Les principes et fonctionnement de l’environnement Spark : RDD, DataFrame, DataSet…

Manipuler des données avec Python, Pyspark
Rappels sur Python et la manipulation des données
Utilisation de SparkSQL et des DataFrames pour manipuler des données
Bonnes pratiques de Spark pour la manipulation de volume important de données

Architecture et composants de la plateforme Hadoop
Chargement des données depuis Hadoop, depuis des fihiers csv…
Transformer des données (création de DataFrames, ajout de colonnes, filtres…)
Cas pratiques de chargement et de modifications de données avec PySpark

Comprendre MLlib avec les principaux algorithmes d’apprentissage et méthodes statistiques (régression, discrimination, foret aléatoires, etc.)
Utiliser spark.ml pour la machine learning
Traitement de données textuelles

Automatiser vos analyses avec des pipelines
Analyser en temps réel avec Spark streaming
Principe de fonctionnement
Présentation des Discretized Streams
Les différents types de sources
Manipulation de l’API
Comparaison avec Apache Storm

Prérequis

Cette formation ne nécessite aucun pré-requis.

Public

Cette formation s’adresse à toute personne intéressée par la technologie Spark et sa mise en oeuvre avec le langage Python.

Ces formations pourraient vous intéresser

Formation Oracle Database SQL OCA

Proposé par PLB CONSULTANT

Objectifs de la formation

Ce cours prépare au passage de l'examen de certification Oracle Database SQL OCA.
Il permet de valider que vous disposez des compétences suivantes :

  • Afficher des données restreintes et triées à l’aide des fonctions de tri et la sélection de colonnes
  • Utiliser des fonctions
  • Restituer des données agrégées à l'aide des fonctions de groupe (group by)
  • Afficher les données de plusieurs tables
  • Utiliser des sous-requêtes
  • Utiliser les « Set Operators »
  • Manipuler des données (insert, update, delete, transactions)
  • Utiliser des instructions pour créer et gérer des tables (LDD)
  • Manipuler les objets vues, séquences et synonymes
  • Gestion des objets avec les vues du dictionnaire de données
  • Contrôler l'accès des utilisateurs
  • Gérer les objets de schémas (contraintes, index, table externe, …)
  • Manipuler les ensembles des données volumineux
  • Générer des rapports par l'utilisation des groupes de données (rollup, cube, grouping)
  • Gérer les données dans différents fuseaux horaires
  • Manipuler des données en utilisant les sous-requêtes
  • Ecrire des requêtes hiérarchiques
  • Utiliser des expressions régulières
Tarif

A partir de 1 860,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, cette formation SwiftUI vous apporte les connaissances et compétences nécessaires pour :

  • Savoir créer des vues Swift UI et les intégrer dans un projet Xcode
  • Savoir partager des données entre des vues avec Swift UI
  • Maîtriser la navigation entre les vues Swift UI
  • Savoir gérer les widgets classiques avec Swift UI (listes, onglets, etc.)
  • Savoir dessiner avec Swift UI (formes, vecteurs…)
  • Savoir utiliser les gestures avec Swift UI
Tarif

A partir de 1 860,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Optimiser des tâches, automatiser des processus et gagner du temps précieux grâce à la rédaction de prompts efficaces.
  • Utiliser l'IA pour interpréter des données et prendre des décisions éclairées.
  • Améliorer sa gestion du temps et son organisation.
Tarif

A partir de 855,00 €

Durée

1 jour ( 7 heures)

Modes
  • Entreprise
  • Distance
  • Centre

Objectifs de la formation

À l'issue de cette formation Dynamics CRM 2016 - Introduction présentation de l'outil vous aurez acquis les connaissances et compétences nécessaires pour : 

  • Découvrir les concepts clés de Microsoft Dynamics CRM 2016
  • Identifier la nature des informations stockées dans l'outil de CRM et savoir les utiliser pour servir les objectifs de son organisation
  • Savoir configurer ses options personnelles
  • Mesurer l’intérêt de Dynamics CRM 2016 pour Outlook et de l’accès en mode hors connexion
  • Comprendre comment rechercher des données Microsoft Dynamics CRM et générer des rapports sur ces données
  • Disposer d’une vision globale de l’outil et identifier ses apports pour l’entreprise
  • Prendre en main les outils Dynamics CRM 2016 pour tablette et téléphone
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Apache Spark Optimisation, vous aurez acquis les connaissances et compétences nécessaires pour :

  • S'approprier les cinq problématiques de performances les plus communes dans une application Spark et leurs principales méthodes de résolution
  • Investiguer, identifier et traiter des problèmes de performances les plus communs associés à l'ingestion de données
  • Appréhender les nouvelles fonctionnalités de Spark 3.x permettant de traiter les problèmes de performance dans vos applications Spark
  • Configurer des clusters Spark pour une performance maximale pour des besoins métier spécifiques
Tarif

A partir de 1 750,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise

Excel - Listes de données

Proposé par GROUPE LEXOM

Objectifs de la formation

  • Trier, interroger et analyser une liste de données
  • Extraire des données précises d'une liste de données
  • Utiliser les tableaux croisés
  • Créer un rapport
Tarif

A partir de 1 390,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement, à l'issue de cette formation TOGAF 9.2 Foundation, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre l’ensemble du contenu de TOGAF® 9.2 et être autonome pour en travailler individuellement les détails dans le texte original
  • Développer une architecture pour votre entrerprise
  • Maitrise des techniques et livrables clefs du cycle ADM
  • Adapter l’ADM
  • Le Continuum d’Entreprise : réutilisation, partitionnement,
  • Connaissance des modèles de référence TOGAF®
  • Maitrise du Cadre de Capacité d’Architecture.
Tarif

A partir de 3 990,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Savoir développer une application Angular
  • Récupérer et afficher des données à partir d'une API REST
  • Communiquer avec un serveur Cloud : Firebase de Google
  • Utitliser PostMan pour tester une API
  • Utiliser les Observer et les Observables
  • Mettre en place les routes sur une Single Page Application
Tarif

A partir de 2 950,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Découvrir la Data Science et le métier de Data Scientist
  • Comprendre les concepts clés de la Data Science
  • Savoir utiliser les outils et méthodologies du Data Scientist
  • Pouvoir programmer en R ou en Python
  • Avoir des connaissances en machine learning
  • Gérer l'apprentissage supervisé, semi-supervisé et non-supervisé
  • Pouvoir intégrer la Data Science dans votre organisation
Tarif

A partir de 3 500,00 €

Durée

5 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Saisir des données, mettre en forme les cellules (caractères, alignements, formats des nombres, bordures …)
  • Ajouter des formules et fonctions simples dans un tableau
  • Mettre en page et imprimer
  • Manipuler les tableaux longs (filtres, tris …)
  • Représenter les données sous forme de graphiques
Tarif

A partir de 600,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...