Spark en Python : analyse de données et machine learning

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

  • Comprendre le principe de fonctionnement d’Apache Spark
  • Utiliser PySpark pour manipuler des données avec Python
  • Traiter les flux de données en temps réel avec Spark Streaming

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche entreprise

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

DEMOS


Leader de la formation professionnelle et du conseil en ressources humaines
Voir la fiche

Tarif

A partir de 2 050,00 €

Durée 3 jours ( 21 heures )
Modes
  • Entreprise
Sessions

Description

Cette formation en Big Data présente le framework Spark de calcul distribué. Vous écrirez les tâches avec le langage Python en utilisant la bibliothèque PySpark. Vous utiliserez la bibliothèque Machine Learning MLlib ainsi que les technologies Spark SQL, Spark Streaming.

Programme

Introduction au big data
Environnements big data : Hadoop, Mapreduce, Spark, etc.
Découvrir l’environnement Spark
Utilisation Spark : Quels avantages ?
Comment installer Apache Spark
Quelle infrastructure pour utiliser Spark en entreprise ?
Les principes et fonctionnement de l’environnement Spark : RDD, DataFrame, DataSet…

Manipuler des données avec Python, Pyspark
Rappels sur Python et la manipulation des données
Utilisation de SparkSQL et des DataFrames pour manipuler des données
Bonnes pratiques de Spark pour la manipulation de volume important de données

Architecture et composants de la plateforme Hadoop
Chargement des données depuis Hadoop, depuis des fihiers csv…
Transformer des données (création de DataFrames, ajout de colonnes, filtres…)
Cas pratiques de chargement et de modifications de données avec PySpark

Comprendre MLlib avec les principaux algorithmes d’apprentissage et méthodes statistiques (régression, discrimination, foret aléatoires, etc.)
Utiliser spark.ml pour la machine learning
Traitement de données textuelles

Automatiser vos analyses avec des pipelines
Analyser en temps réel avec Spark streaming
Principe de fonctionnement
Présentation des Discretized Streams
Les différents types de sources
Manipulation de l’API
Comparaison avec Apache Storm

Prérequis

Cette formation ne nécessite aucun pré-requis.

Public

Cette formation s’adresse à toute personne intéressée par la technologie Spark et sa mise en oeuvre avec le langage Python.

Ces formations pourraient vous intéresser

Excel - Perfectionnement

Proposé par CIT FORMATION INFORMATIQUE

Objectifs de la formation

Toute personne utilisatrice d'Excel souhaitant concevoir des tableaux de calculs complexes et gérer des analyses de données.

La formation pourra être validée par le passage de la certification TOSA.

À l'issue de la formation, le stagiaire sera capable de :

  • Utiliser les fonctions de calculs avancés
  • Gérer les liaisons et consolidations de tableaux
  • Gérer les listes de données
  • Analyser ses données à l’aide des tableaux croisés dynamiques
  • Concevoir des graphiques élaborés.

Methodes et outils pédagogiques

  • Alternance exposés théoriques et exercices pratiques (80% pratique)
  • Support de cours adapté au logiciel étudié et au niveau suivi
  • Assistance téléphonique gratuite et illimitée
Tarif

Contacter l'organisme

Durée

2 jour(s)

Modes
  • Entreprise
  • Distance

Objectifs de la formation

Plus conrètement, à l'issue de cette formation z/OS Mise en oeuvre d'UNIX System Services, vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Maitriser l'installation z/OS pour l'implémentation de z/OS Unix System Service
  • Installer les fonctionnalités logicielles de z/OS UNIX
  • Réaliser une personnalisation de base nécessaire à l'implémentation du noyau z/OS Unix System Service,
  • Personnaliser le système de fichiers, le shell et les utilitaires, ainsi que les applications.
  • Mettre en place la sécurité RACF nécessaire aux ressources z/OS UNIX et aux applications
  • Activer les sockets TCP/IP par z/OS UNIX
  • Identifier et utiliser les processus et données nécessaires pour surveiller et régler l'environnement
Tarif

A partir de 3 150,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Adopter le Design Thinking comme démarche d’innovation
  • S’approprier les outils du Design Thinking et découvrir le modèle par la pratique
  • Pitcher son projet et obtenir l’adhésion
Tarif

A partir de 1 450,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance
  • Entreprise

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Décrire les tâches et les objectifs du calcul du coût de revient réel
  • Implémenter le calcul du coût de revient réel dans SAP S/4HANA
  • Dérouler la clôture de période dans le cadre du calcul du coût de revient réel
  • Interpréter les états et les résultats du calcul du coût de revient réel.
Tarif

A partir de 2 460,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Connaître les approches classiques et mathématiques de la valeur d’une action
  • Connaître et savoir appliquer l’analyse chartiste de la valeur d’une action
  • Savoir lire et interpréter les cours des actions
Tarif

A partir de 150,00 €

Durée

2 heures 45 minutes

Modes

Les bases de données relationnelles

Proposé par CIT FORMATION INFORMATIQUE

Objectifs de la formation

 La formation a pour objectif d’apprendre les principes de base et appréhender les environnements classiques de Bases de Données relationnelles.

À l'issue de la formation, le stagiaire sera capable de :

  • De comprendre le concept des Bases de Données relationnelles

Methodes et outils pédagogiques

  • Alternance exposés théoriques et exercices pratiques (80% pratique)
  • Support de cours adapté au niveau suivi

Evaluation

  • Tout au long de la formation, exercices pratiques permettant au formateur la validation des acquis et des compétences

Public concerné

Utilisateurs de bases de données relationnelles.

Pré-requis

Aucun pré-requis nécessaire

Tarif

Contacter l'organisme

Durée

1 jour(s)

Modes
  • Entreprise

Objectifs de la formation

Cette formation Analyse de données avec SQL Server 2016/2019 Reporting Services, vous apprend les connaissances et compétences nécessaires pour :

  • Décrire les caractéristiques principales de la modélisation des données au sein de la Business Intelligence
  • Connaître les différentes sources de données de services de rapport et comment ceux-ci sont configurés
  • Créer des rapports avec le concepteur de rapports ou avec le générateur de rapports
  • Configurer les rapports avec le concepteur de rapports ou avec le générateur de rapports
  • Créer des rapports mobiles SQL Server
Tarif

A partir de 2 990,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Projet Data/IA vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Repérer les potentiels d’utilisation de la donnée au sein de votre organisation
  • Repérer votre patrimoine data (interne et externe) et ses limites
  • Challenger les attendus d’un projet d’analyse prédictive : la question est elle bien posée ? sait on décrire l’usage qui sera fait des résultats ? Y a-t-il une vocation à industrialiser ou s’agit-il de diagnostiquer un comportement ?
  • Anticiper les biais inhérents à tout projet data : les détecter, les évaluer : peut-on les corriger ? sinon sont-ils assumés ?
  • Sécuriser le respect des règles du RGPD
  • Piloter le gain économique du projet au-delà des métriques spécifiques à l’IA
  • Comprendre les infrastructures sous-jacentes aux projets d’IA (Big Data)
  • Comprendre l’écosystème d’outils mobilisés : Python / scikit learn / Tensorflow / …
  • Identifier les approches analytiques pertinentes (supervisé, non supervisé, principaux modèles)
  • Rythmer et piloter le projet au sein des équipes techniques (méthodes agiles, devops, ML Ops)
  • Comprendre les enjeux et ressources de la datavisualisation
  • Arbitrer la poursuite ou l’arrêt du projet, sauvegarder les acquis
Tarif

A partir de 1 995,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Big Data Analyse Visualisation, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Comprendre les spécificités du Big Data
  • Connaître les concepts fondamentaux et technologies associées au Big Data
  • Gérer, collecter et explorer des données
  • Analyser et visualiser ces données
Tarif

A partir de 2 390,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Utiliser le langage SQL pour accéder aux données et pour les modifier
  • Contrôler l’accès des données de tables locales ou liées
  • Se connecter à des bases de données externes
  • Afficher des données externes dans une interface conviviale
  • Parcourir, trier ou filtrer les données externes
  • Modifier ou créer des données de tables locales ou distantes
  • Gérer l’accès aux données et contrôler les modifications
  • Partager des données sur d’autres applications office (Word, Excel ou Outlook)
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...