Web scraping avec Python

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Réaliser du scraping de données
  • Faire les actions d'ingestion nécessaires pour alimenter un Data Lake.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 2 010,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 2 010,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Les bases du langage Python

  • Les caractéristiques du langage Python
  • Pourquoi choisir Python pour l'analyse de données ?
  • Types de bases
  • Les instructions de bases
  • Les procédures et fonctions

L'ingestion avec Python

  • Utiliser la librairie Pandas pour manipuler les données
  • Introduction du concept de DataFrame
  • Les structures :
    • Interrogation
    • Indexation
  • Traitement de "données manquantes"
  • Fusion de DataFrames
  • Manipulation des dates
  • Application de mesures statistiques variées sur les DataFrames
  • Bonne compréhension des problèmes d'échelle de mesure, de normalisation
  • Création de métriques d'analyse

Scraping de données

  • Qu'est-ce que le scraping ?
  • Définition du scraping et de ses différents niveaux de difficulté sur plusieurs supports
    • Depuis le Web
    • Depuis du papier
    • Depuis des PDF
  • Exemples de projets réalisés grâce au scraping
  • L'architecture d'Internet
  • Qu'est-ce qu'un "client" ? Qu'est-ce qu'un "serveur" ? Pourquoi est-ce important ?
  • Comment HTTP et HTML impactent-t-ils nos scrapers ?
  • Qu'est-ce qu'une balise HTML ? Un attribut ?
  • Comment identifier certains éléments avec une "class" ou un "id" ?

Python comme solution ETL

  • Les formats de données structurées : CSV, flux XML et JSON
  • Lecture et écriture de fichiers
  • Exploitation des données de fichiers de différentes sources
  • Fonctions d'accès et de chargement de données en blocs de lignes
  • Outils spécifiquement dédiés au scraping :
    • Beautiful Soup
    • CSS Select

Mise en oeuvre d'un scraper

  • Un scraper simple (requêtes GET, pages séquencées)
  • Identifier la stratégie à adopter pour naviguer sur le site
  • Coder le scraper
  • Un scraper complexe : envoyer des données à un site Internet pour obtenir des résultats plus complexes
  • Qu'est ce qu'une requête POST et une requête GET ?
  • Parcourir un site pour trouver les données
  • Identifier la stratégie à adopter
  • Coder le scraper

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir des connaissances de base sur Python et en algorithmique.

Public

Développeurs, intégrateurs, chefs de projets, consultants BI.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Installer SharePoint 2019 et configurer les options de déploiement
  • Gérer les applications web et collections de sites
  • Configurer les applications de service
  • Gérer les utilisateurs, les autorisations et l'authentification dans SharePoint 2019
  • Gérer la recherche d'entreprise
  • Surveiller et dépanner une ferme SharePoint
Tarif

A partir de 3 000,00 €

Durée

4 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Réaliser des animations au format Web HTML 5 sans avoir à connaître un langage de programmation
  • Créer des présentations interactives
  • Exporter les animations Motion Design au format vidéo.
Tarif

A partir de 920,00 €

Durée

2j / 14h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • De créer des requêtes combinées et utiliser des sous-requêtes
Tarif

A partir de 2 300,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Mettre en place une interface HTML5 et CSS3 ;
  • Créer un site web responsive ;
  • Utiliser l'ensemble de la bibliothèque Bootstrap 3.
Tarif

A partir de 4 650,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Comprendre les Web Services et leurs composants
  • Utiliser XML et Java dans les Web Services
  • Concevoir des services RESTful avec Java et CXF
  • Implémenter et interagir avec des services SOAP
  • Créer et manipuler des documents WSDL
  • Utiliser et gérer l'annuaire UDDI
  • Développer et déployer des Web Services avec Java EE
  • Assurer la sécurité et les transactions des Web Services
Tarif

A partir de 3 000,00 €

Durée

5 jours

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Identifier et décrire les principes de développement avec la plateforme Jakarta EE
  • Décrire les principes du développement en couches et identifier les responsabilités des composants dans le modèle MVC
  • Mettre en place et utiliser un environnement de développement pour concevoir et déboguer une application Web Jakarta EE
  • Mettre en place une couche de persistance métier
  • Développer des composants servlets pour implémenter la navigation dans l’application
  • Développer les vues affichant les données avec la technologie Server Pages et Jakarta Standard Tag Library
  • Coder des composants applicatifs complémentaires tels que des filtres et des écouteurs événements applicatifs
  • Sécuriser une application Web Jakarta EE en utilisant le modèle de sécurité offert par la plateforme
  • Packager, déployer et configurer une application Web Jakarta EE sur un serveur d’application
Tarif

Contacter l'organisme

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Configurer les paramètres avancés des services réseau DHCP, DNS et IPAM - Configurer et gérer les paramètres avancés des services de fichiers iSCSI, BranchCache et FSRM - Configurer le contrôle d'accès dynamique (DAC) pour gérer et contrôler l'accès aux fichiers partagés - Mettre en œuvre le déploiement distribué d'AD DS - Mettre en œuvre les sites AD DS et la réplication - Mettre en œuvre les services de certificats (AD CS) - Mettre en œuvre la gestion des droits (AD RMS) - Mettre en œuvre les services de fédération (AD FS) - Assurer la haute disponibilité et l'équilibrage de charge pour les applications Web par la mise en œuvre de l'équilibrage de charge réseau (NLB) - Assurer la haute disponibilité pour les services réseau et les applications par la mise en œuvre du cluster avec basculement - Déployer et gérer des machines virtuelles Hyper-V dans un cluster avec basculement - Mettre en œuvre une solution de sauvegarde et de reprise après incidents
Tarif

A partir de 2 450,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Spark avec Databricks

Proposé par M2I

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Identifier les caractéristiques principales de Spark et des Databricks
  • Décrire comment les DataFrames sont créées et évaluées dans Spark
  • Appliquer les transformations DataFrame pour traiter et analyser les données
  • Appliquer le streaming structuré pour traiter les données en continu.
Tarif

A partir de 2 280,00 €

Durée

3j / 21h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Décrire l'architecture multicouche et l'intérêt des frameworks ;
  • Décrire les problématiques liées à la production et au déploiement des applications, et identifier les intérêts de l'intégration continue ;
  • Installer un environnement de production/construction Gradle ;
  • Créer un projet Gradle Java en ligne de commande et avec l'IDE Eclipse ;
  • Décrire l'architecture et le fonctionnement de l'API de persistance JPA ;
  • Réaliser les mappings entre les classes Java et les tables de bases de données ;
  • Manipuler les instances d'objets persistants avec l'API JPA ;
  • Identifier les apports et décrire les mécanismes d'injection de dépendances ;
  • Configurer Spring à travers le fichier XML et utiliser les annotations spécifiques ;
  • Implémenter la couche d'accès aux données avec Spring JDBC et Spring ORM ;
  • Construire et expoloiter les données de formulaires de saisie avec Spring MVC ;
  • Utiliser un Web Service REST dans un environnement Spring avec Spring REST ;
  • Configurer Tomcat pour un accès HTTPS et sécuriser l'accès aux applications Web grâce à l'authentification basée sur les rôles.
Tarif

A partir de 990,00 €

Durée

37 heures

Modes
  • Distance

Objectifs de la formation

  • Comprendre l’environnement d’une application Web construite autour de PHP et les mécanismes de base du protocole HTTP.
  • Installer une plateforme d’exécution et de développement pour PHP.
  • Appréhender la syntaxe et l’algorithmie de base du langage PHP.
  • Comprendre l’échange de données en HTTP.
  • Utiliser le modèle de programmation orientée objet de PHP
  • Créer des classes et des objets.
  • Utiliser les mécanisme de programmation orientée objet tels que l'héritage et l'encapsulation.
  • Utiliser les classes abstraites et les interfaces.
  • Créer et traiter des formulaires
  • Suivre la navigation utilisateur en utilisant les sessions.
  • Accéder à des bases de données relationnelles depuis une application PHP.
  • Manipuler et transférer des fichiers dans une application.
Tarif

A partir de 2 850,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...