Spark en Python : analyse de données et machine learning

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre le principe de fonctionnement d’Apache Spark
  • Utiliser PySpark pour manipuler des données avec Python
  • Traiter les flux de données en temps réel avec Spark Streaming

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche entreprise

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

Description

Cette formation en Big Data présente le framework Spark de calcul distribué. Vous écrirez les tâches avec le langage Python en utilisant la bibliothèque PySpark. Vous utiliserez la bibliothèque Machine Learning MLlib ainsi que les technologies Spark SQL, Spark Streaming.

Programme

Introduction au big data
Environnements big data : Hadoop, Mapreduce, Spark, etc.
Découvrir l’environnement Spark
Utilisation Spark : Quels avantages ?
Comment installer Apache Spark
Quelle infrastructure pour utiliser Spark en entreprise ?
Les principes et fonctionnement de l’environnement Spark : RDD, DataFrame, DataSet…

Manipuler des données avec Python, Pyspark
Rappels sur Python et la manipulation des données
Utilisation de SparkSQL et des DataFrames pour manipuler des données
Bonnes pratiques de Spark pour la manipulation de volume important de données

Architecture et composants de la plateforme Hadoop
Chargement des données depuis Hadoop, depuis des fihiers csv…
Transformer des données (création de DataFrames, ajout de colonnes, filtres…)
Cas pratiques de chargement et de modifications de données avec PySpark

Comprendre MLlib avec les principaux algorithmes d’apprentissage et méthodes statistiques (régression, discrimination, foret aléatoires, etc.)
Utiliser spark.ml pour la machine learning
Traitement de données textuelles

Automatiser vos analyses avec des pipelines
Analyser en temps réel avec Spark streaming
Principe de fonctionnement
Présentation des Discretized Streams
Les différents types de sources
Manipulation de l’API
Comparaison avec Apache Storm

Prérequis

Cette formation ne nécessite aucun pré-requis.

Public

Cette formation s’adresse à toute personne intéressée par la technologie Spark et sa mise en oeuvre avec le langage Python.

Ces formations pourraient vous intéresser

Objectifs de la formation

Evaluer et déterminer les différentes solutions de déploiement du poste de travail - Planifier une stratégie de gestion d'images - Mettre en œuvre la sécurité du poste de travail - Capturer et gérer une image du système d'exploitation - Planifier et mettre en œuvre User State Migration Tool - Planifier et déployer des postes de travail en utilisant Microsoft Deployment Toolkit - Planifier et déployer les postes de travail en utilisant System Center 2012 Configuration Manager - Planifier et mettre en œuvre Remote Desktop Services - Gérer la virtualisation de l'état utilisateur des postes de travail - Planifier et mettre en œuvre les mises à  jour pour assurer le support - Protéger les postes de travail contre les logiciels malveillants et les pertes de données - Surveiller les performances et la bonne santé de l'infrastructure du poste de travail
Tarif

A partir de 2 450,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • S'approprier l'interface de travail Microsoft Excel
  • S'entraîner à effectuer les manipulations de base : saisie, copie, déplacement...
  • Savoir créer, mettre en forme et partager des tableaux
  • Connaître les bonnes pratiques pour organiser son travail
  • Savoir utiliser les fonctions et formules courantes
  • S'initier à la gestion des données sur Excel avec les tris et graphiques
Tarif

A partir de 800,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Configurer et administrer la confidentialté des données stockées sur les baies de stockage NetApp avec ONTAP 9.x
  • Prévenir les actes de vol, piratage, sabotage sur les données stockées.
Tarif

A partir de 1 900,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les outils digitaux pertinents pour la digitalisation des formations
  • Analyser les avantages et les inconvénients de l'utilisation des outils digitaux dans la formation
  • Concevoir des modules de formation digitale en utilisant des outils adaptatifs et personnalisés
  • Créer des formations personnalisées qui placent l'apprenant au centre de l'apprentissage
  • Evaluer la pertinence et l'efficacité des nouveaux modèles d'apprentissage adaptés au monde du travail actuel
  • Identifier les différentes phases du processus de digitalisation des formations en utilisant la méthode SAMR
  • Evaluer les enjeux de la digitalisation des formations pour une entreprise en analysant ses besoins réels, en définissant des indicateurs clés de performance (KPI) et en identifiant les moteurs de réussite
  • Concevoir des stratégies visant à stimuler l'envie d'apprendre chez les apprenants et à accroître leur compétitivité
  • Mettre en place une démarche de veille technologique efficace en pratiquant la veille, en exploitant les informations recueillies et en optimisant leur utilisation dans le contexte de la digitalisation des formations.
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Expliquer la plateforme SAP BusinessObjects Business Intelligence
  • Gérer le contenu et les objets dans la plateforme SAP BusinessObjects Business Intelligence
  • Organiser les objets
  • Sécuriser les utilisateurs et les groupes
  • Gérer et sécuriser les applications
  • Distribuer le contenu aux utilisateurs.
Tarif

A partir de 1 640,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Oracle - Développer avec Oracle PL/SQL

Proposé par CIT FORMATION INFORMATIQUE

Objectifs de la formation

Acquérir les compétences pour développer des programmes PL/SQL pour accéder aux bases Oracle et créer des procédures stockées et des fonctions pour une réuilisation maximale et une maintenance du code minimale et concevoir des applications modulaires avec des packages. Gérer la récupération des données pour les applications frontales et invoquer du SQL Dynamique natif pour créer du code de haut niveau.

Tarif

Contacter l'organisme

Durée

3 jour(s)

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Décrire et expliquer la réglementation en vigueur et la mettre en lumière autour de cas concrets
  • Acquérir des données suffisantes (réflexes) pour évaluer correctement les situations à risques
  • Adopter les bons comportements et mettre en oeuvre les solutions juridiques adaptées
Tarif

A partir de 1 390,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Utiliser les principales fonctionnalités du module SAP Comptabilité Financière et de naviguer dans l'application en toute autonomie
  • Créer les données de base (comptes généraux, fournisseurs, clients, immobilisations, banques)
  • Décrire le déroulement des principaux processus comptables du module SAP Comptabilité Financière, de la saisie des pièces comptables aux campagnes de paiement et de relances, ainsi que l'édition des reportings financiers
  • Expliquer l'intégration avec les autres modules de SAP
  • Identifier les principales opérations de clôture.
Tarif

A partir de 4 100,00 €

Durée

5j / 35h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Concevoir une solution d’analyse pour vos formulaires métier à l’aide d’Azure AI Document Intelligence
  • Créer une solution qui analyse les documents courants à l’aide de Document Intelligence
  • Créer une solution qui analyse différents types de formulaires personnalisés en utilisant Document Intelligence
  • Inclure un service Azure AI Intelligence documentaire en tant que compétence personnalisée dans un pipeline Recherche Azure AI
Tarif

Contacter l'organisme

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier les données juridiques et psychosociologiques en lien avec son rôle de référent
  • Elaborer sa propre méthode permettant de faire face aux situations de harcèlement sexuel et d'agissements sexistes
Tarif

A partir de 1 133,00 €

Durée

1 jour

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...