Formation Big Data - Python pour l'analyse de données (cours dédié aux actions collectives Atlas)

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

À l'issue de cette formation Big Data Python, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Utiliser le langage Python dans la modélisation statistique
  • Utiliser les outils d’analyse des données en Python
  • Préparer différents types de données à l’analyse (nettoyage)
  • Extraire les données de différentes sources (fichier, base de données, etc.)
  • Déterminer les fonctions à utiliser selon le type de données
  • Évaluer les performances prédictives d’un algorithme
  • Utiliser Python dans un environnement Big Data
  • Apprendre à mettre en place un modèle d'apprentissage simple Choisir entre la régression et la classification en fonction du type de données
  • Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
  • Connaître les possibilités de représentations graphiques en Python

PLB CONSULTANT


Informatique et Management
Voir la fiche entreprise

Tarif

A partir de 1 995,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

PLB CONSULTANT


Informatique et Management
Voir la fiche

Tarif

A partir de 1 995,00 €

Durée 3 jours (21h)
Modes
  • Centre
  • Entreprise
  • Distance
Sessions
Lieux Partout en France

Description

Cette formation sur l’analyse de données en Python permet aux participants dans un premier temps de découvrir et apprendre le langage Python puis de comprendre pourquoi Python est particulièrement bien adapté à toutes sortes de problèmes d’analyse de données.

Lors de ce cours les participants aborderont donc le traitement de différents formats de données structurées ou non (tableau, matrice, série, CSV, flux XML ou JSON, etc.) tout en les rendant opérationnel dans l’utilisation des principales bibliothèques Python comme NumPy, Pandas, Matplotlib, IPython, SciPy, etc…

Programme

Jour 1

Rappels des bases de Python

Les caractéristiques du langage Python
Pourquoi choisir Python pour l’analyse de données ?
Philosophie de Python (indentation, objet, etc.)
Les types de données
Appels de fonctions et méthodes
Structures de contrôles (boucle, test, exceptions)
Structures de données et séquences (tuple, liste, primitives, dict)
Les principales bibliothèques de Python (NumPy, Pandas, Matplotlib, Ipython, SciPy)
AtelierTP de synthèse mettant en œuvre les bibliothèques NumPy, Pandas et SciPy. On utilise un gros fichier CSV des naissances que l’on transforme en tableau (Pandas) et on calcule des statistiques comme le « nombre de Laurent nés en telle année selon les départements », « la moyenne des naissances nationales annuelle et l’écart type par région », etc.

Aspects avancés en Python

Espace de noms, périmètre et fonctions locales
Manipuler les fonctions comme des objets
Les fonctions anonymes (lambda)
Fonction à nombre variable d’arguments (*args, **kwargs)
AtelierÉcriture d’une fonction de tri recevant un nombre arbitraire d’arguments
Passage de la fonction heuristique du tri (celle qui précise si un objet est « plus petit » qu’un autre) à la fonction précédente

Acquisition des données

Lecture de fichiers de manière générique et spécifiquement de différents formats courants : CSV, XML, JSON
Utilisation de la bibliothèque requests pour l’acquisition de données externes stockées sur un serveur de l’entreprise ou sur internet
AtelierCet atelier donnera l’occasion aux participants de mettre au point un moteur de recherche simple dans le système de fichiers. Une fois le système de fichiers indexé, il y sera possible de rechercher par mot-clef un fichier et son contenu automatiquementJour 2

Bibliothèques d’Analyses Statistiques

Présentation des principales bibliothèques d’analyse de données Python : Pandas, SciPy, IPython (Jupyter)
Fonctions de manipulation et de calcul matriciel (Numpy)
Fonctions de Statistiques Descriptives (SciPy) : quantiles et des fonctions de répartition pour
différentes lois statistiques
Fonctions de comparaison de populations, mesures d’association
Fonctions de classification automatique (SciPy) : k-means
AtelierCet atelier permettra aux participants d’appliquer leurs connaissances à la réalisation d’un « mini atelier » d’Analyse Technique pour la Finance des Marchés :
- Collecte automatique de séries financières
- Calcul d’indicateurs : d’indicateurs simples (moyennes mobiles) à des indicateurs avancés (tel que le RSI et les Bandes de Bollinger)
- Visualisation des résultats

Visualisation de données

Introduction aux bases de la visualisation de données
Focalisation sur la génération de graphes grâce à la librairie Matplotlib : démonstration de l’application de graphes Matplotlib à la visualisation de problèmes concrets
AtelierCet atelier permettra de poursuivre les travaux de l’atelier précédent en générant des visualisations graphiques illustrant les analyses de données réalisées (les appels à la bibliothèque Matplotlib sont fournis par le formateur afin de rester concentrer principalement sur l’analyse des données)Jour 3

Régression, Classification et Évaluation des Résultats

Établissement d’un modèle de classification et d’un modèle de régression avec Python pour résoudre deux problèmes distincts
Évaluation du modèle dans son contexte, faux positifs, faux négatifs, matrice de confusion, différents scores de précision
AtelierMise en œuvre d’un modèle de classification et de régression en Python

Deep Learning & Frameworks

Différence entre le machine learning et le deep learning
Introduction aux réseaux de neurones et à la descente de gradient
Introduction aux frameworks de deep learning Tensorflow et Keras de Google
AtelierCet atelier permettra d’étudier un modèle de deep learning en fonctionnement sur un problème de classification d’image. L’objectif est de se familiariser avec la notion de couche de neurones, d’hyperparamètres et d’entraînement de modèle

Big Data & Traitement de gros volumes de données

Introduction à l’algorithme de MapReduce
Introduction à la parallélisation du code dans le but d’améliorer les performances de calcul
Introduction à Spark
La composante Spark ML
AtelierMise en œuvre d’un programme Spark ML en Python afin d’être sensibilisé aux possibilités d’auto apprentissage simple en Python

Prérequis

Il est nécessaire de connaître la programmation Python et d'avoir de bonnes bases en mathématiques et statistiques.

Public

Ce cours Big Data Python convient parfaitement aux développeurs, programmeurs et data analysts ou scientists qui doivent utiliser Python pour l’analyse statistique.
Elle peut également être suivie par toute personne souhaitant utiliser Python pour développer des applications de calcul scientifique ou d’analyse de données.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Créer un document
  • Concevoir des requêtes
  • Présenter les données en tableaux et en diagrammes
  • Mettre en place des formules de calculs
  • Mettre en valeur les données
  • Partager les documents
Tarif

Contacter l'organisme

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

2 jours (14 heures)

Modes
  • Distance
  • Centre

Formation Django

Proposé par Sparks

Objectifs de la formation

  • Installer et configurer Django
  • Créer et gérer des vues et des URLconfs
  • Utiliser les modèles de Django
  • Manipuler les données via les modèles
  • Personnaliser les données et gérer les permissions
  • Implémenter des formulaires avec Django
  • Utiliser les balises et les filtres de modèle
  • Appliquer le modèle MVC
Tarif

A partir de 2 400,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation NetApp ONTAP vous aurez acquis les connaissances et compétences nécessaires pour :

  • Définir les composants d'un cluster ONTAP
  • Décrire le rôle d'une VM de stockage (machine virtuelle de stockage, également appelée SVM) dans l'architecture de stockage NetApp
  • Configurer un cluster ONTAP
  • Configurer et gérer les ressources de stockage
  • Configurer et gérer les ressources de réseau
  • Créer et configurer une VM de stockage
  • Créer, gérer et protéger les volumes NetApp FlexVol®
  • Mettre en œuvre des fonctions d'efficacité du stockage
  • Gérer l'accès administrateur et les comptes utilisateurs ONTAP
  • Maintenir les systèmes de stockage NetApp
  • Décrire et distinguer les fonctions de protection des données du logiciel ONTAP
  • Administrer la fonction de protection des données ONTAP appropriée pour répondre à votre problème de protection des données
  • Configurer les relations NetApp SnapMirror® pour la reprise après sinistre et la sauvegarde des données.
  • Démontrer la SVM DR
  • Illustrer les opérations NDMP pour sauvegarder les données NAS sur bande
  • Intégrer les solutions de protection des données basées sur le cloud qui complètent vos systèmes de stockage ONTAP
  • Structurer les composants et les fonctionnalités de NetApp MetroCluster™
  • Illustrer les composants et fonctionnalités de NetApp SnapMirror Business Continuity
Tarif

A partir de 4 500,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Appréhender l'univers des bases de données NoSQL
  • Identifier les caractéristiques techniques de bases NoSQL
  • Différencier bases de données SQL et NoSQL
  • Savoir choisir un type de base de données selon son contexte
  • Connaître les principales solutions NoSQL du marché
Tarif

A partir de 1 400,00 €

Durée

2 jours

Modes
  • Centre
  • Entreprise
  • Distance

Formation Développer en PL/SQL

Proposé par PLB CONSULTANT

Objectifs de la formation

Savoir développer des applications ORACLE.

Ce cours a plusieurs objectifs : 

  • comprendre la place du PL/SQL dans les architectures applicatives 
  • acquérir la maîtrise du langage PL/SQL
  • maîtriser les interactions entre PL/SQL et ORACLE
  • connaître les fonctions et packages standards
  • savoir écrire des procédures stockées et des packages
  • maîtriser la philosophie et la syntaxe des triggers 
  • disposer d'une charte de développement professionnel en PL/SQL : conception, codage modulaire, style et méthode de programmation, stratégie de débogage.
Tarif

A partir de 1 830,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Importer, se connecter à différentes sources de données Excel et externes
  • Nettoyer, filtrer, transformer, structurer les données
  • Travailler sur plusieurs sources de données : les croiser (équivalent de RECHERCHEV dans Excel), les cumuler (regrouper des données les  unes à la suite des autres) 
  • Exploiter les résultats des requêtes dans Excel : sous forme de "Tableau" de données ou de tableaux croisés dynamiques
Tarif

A partir de 450,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Formation Support PC niveau 2

Proposé par PLB CONSULTANT

Objectifs de la formation

Les avancées technologiques et l'apparition de nouveaux standards matériels (y compris les tablettes, les smartphones…) ou logiciels, font évoluer sans cesse la maintenance des PC et de leurs périphériques fixes ou mobiles. Cette formation, dans laquelle les travaux pratiques ont un rôle central, vous présentera les différents outils, techniques et méthodes de configuration de vos systèmes de prévention et de gestion des incidents impliquant la perte de données et la gestion des interventions. Vous serez capable de vous constituer une véritable « trousse à outils » vous permettant de faire face en totale autonomie à toutes les situations (problème de démarrage, virus, performances, perte de données, etc.). La formation traite toutes les versions de Windows et s'articule autour de situations concrètes du quotidien.

Tarif

A partir de 2 490,00 €

Durée

4j / 28h

Modes
  • Centre
  • Entreprise

Objectifs de la formation

  • Gérer les PCs et les périphériques mobiles dans un environnement d'entreprise
  • Analyser les données via les requêtes et les rapports
  • Préparer une infrastructure de gestion pour la gestion des PCs et périphériques mobiles
  • Déployer et gérer le client Configuration Manager
  • Configurer, gérer et surveiller l'inventaire matériel et logiciel
  • Identifier et configurer la méthode la plus appropriée pour distribuer et gérer le contenu utilisé pour les déploiements
  • Distribuer, déployer et surveiller les applications pour les utilisateurs et les systèmes
  • Maintenir les mises à jour logicielles pour les PCs gérés par Configuration Manager
  • Mettre en œuvre Endpoint Protection pour la gestion des PCs
  • Gérer la conformité et la sécurisation de l'accès aux données
  • Configurer une stratégie de déploiement du système d'exploitation avec Configuration Manager
  • Gérer et maintenir un site Configuration Manager
Tarif

A partir de 2 950,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Gérer des paquets avec une nouvelle structure de référentiel et des modules AppStream
  • Créer des périphériques de stockage, de volumes et de systèmes de fichiers, avec notamment la gestion du stockage Stratis
  • Savoir configurer des services réseau et de fonctions de sécurité
  • Conaitre la gestion des processus, de la planification et de l'optimisation
  • Maitriser la gestion des utilisateurs, des groupes et de l'authentification
  • Gérer des serveurs avec l'outil de gestion web Cockpit
  • Résoudre des problèmes et mettre en place une assistance

Ce cours repose sur la version 8 de Red Hat® Enterprise Linux.

Tarif

A partir de 4 517,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise

Je cherche à faire...