Web scraping avec Python

Public admis

  • Salarié en Poste
  • Demandeur d'emploi
  • Entreprise
  • Etudiant

Financements

Eligible CPF Votre OPCO Financement personnel

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Réaliser du scraping de données
  • Faire les actions d'ingestion nécessaires pour alimenter un Data Lake.

M2I


Un leadership dans le domaine de la formation
Voir la fiche entreprise

Tarif

A partir de 2 010,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

M2I


Un leadership dans le domaine de la formation
Voir la fiche

Tarif

A partir de 2 010,00 €

Durée 3 jours  (21h00)
Modes
  • Centre
  • Distance
Sessions
Lieux Partout en France

Programme

Les bases du langage Python

  • Les caractéristiques du langage Python
  • Pourquoi choisir Python pour l'analyse de données ?
  • Types de bases
  • Les instructions de bases
  • Les procédures et fonctions

L'ingestion avec Python

  • Utiliser la librairie Pandas pour manipuler les données
  • Introduction du concept de DataFrame
  • Les structures :
    • Interrogation
    • Indexation
  • Traitement de "données manquantes"
  • Fusion de DataFrames
  • Manipulation des dates
  • Application de mesures statistiques variées sur les DataFrames
  • Bonne compréhension des problèmes d'échelle de mesure, de normalisation
  • Création de métriques d'analyse

Scraping de données

  • Qu'est-ce que le scraping ?
  • Définition du scraping et de ses différents niveaux de difficulté sur plusieurs supports
    • Depuis le Web
    • Depuis du papier
    • Depuis des PDF
  • Exemples de projets réalisés grâce au scraping
  • L'architecture d'Internet
  • Qu'est-ce qu'un "client" ? Qu'est-ce qu'un "serveur" ? Pourquoi est-ce important ?
  • Comment HTTP et HTML impactent-t-ils nos scrapers ?
  • Qu'est-ce qu'une balise HTML ? Un attribut ?
  • Comment identifier certains éléments avec une "class" ou un "id" ?

Python comme solution ETL

  • Les formats de données structurées : CSV, flux XML et JSON
  • Lecture et écriture de fichiers
  • Exploitation des données de fichiers de différentes sources
  • Fonctions d'accès et de chargement de données en blocs de lignes
  • Outils spécifiquement dédiés au scraping :
    • Beautiful Soup
    • CSS Select

Mise en oeuvre d'un scraper

  • Un scraper simple (requêtes GET, pages séquencées)
  • Identifier la stratégie à adopter pour naviguer sur le site
  • Coder le scraper
  • Un scraper complexe : envoyer des données à un site Internet pour obtenir des résultats plus complexes
  • Qu'est ce qu'une requête POST et une requête GET ?
  • Parcourir un site pour trouver les données
  • Identifier la stratégie à adopter
  • Coder le scraper

Le contenu de ce programme peut faire l'objet d'adaptation selon les niveaux, prérequis et besoins des apprenants.

Modalités d’évaluation des acquis

  • En cours de formation, par des études de cas ou des travaux pratiques
  • Et, en fin de formation, par un questionnaire d'auto-évaluation

Prérequis

Avoir des connaissances de base sur Python et en algorithmique.

Public

Développeurs, intégrateurs, chefs de projets, consultants BI.

Ces formations pourraient vous intéresser

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

3 jours (21 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation ZOPE vous aurez aquis les connaissances et compétences nécessaires pour : 

  • Connaître le serveur d'applications
  • Connaître le component Architecture
  • Connaître le Framework MVC (Grok)
  • Connaître l'intégration WSGI (Web Server Gateway Interface
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

Concrètement à l'issue de cette formation AWS - Opérations système sur Amazon Web Services vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Utiliser les fonctionnalités d'Amazon EC2 pour mettre en service, surveiller, dimensionner et distribuer une infrastructure de calcul
  • Créer des ressources Amazon Virtual Private Cloud (VPC) telles que des sous-réseaux, des listes de contrôle d'accès au réseau et des groupes de sécurité
  • Sauvegarder des ressources stockées sur AWS et sur site à l'aide des services AWS
  • Créer des sous-réseaux Amazon EC2-VPC
  • Utiliser les mesures Amazon CloudWatch pour surveiller l'état de santé et l'utilisation des ressources AWS
  • Utiliser AWS CloudFormation pour automatiser la mise en service et le déploiement de l'infrastructure
  • Exploiter l'ajout de balises aux ressources pour répartir les coûts et optimiser la planification des ressources.
Tarif

A partir de 2 450,00 €

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Cette formation fait l'objet d'une évaluation formative.
Tarif

Contacter l'organisme

Durée

3 jours (21 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

A l'issue de cette formation, vous serez capable de :

  • Mesurer les impacts sur l'empreinte carbone
  • Décrire les impacts sur les visiteurs d'un site Web et sur le référencement par Google
  • Renforcer la vitesse de chargement des images d'un site Web par le navigateur
  • Assurer une haute qualité visuelle
  • Préparer et décliner les images pour les écrans : sites Web et terminaux mobiles, tablettes iPad et Android, Smartphones iPhone et Android
  • Reconnaître les outils disponibles pour WordPress
  • Améliorer le SEO grâce aux balises d'images (Search Engine Optimization).
Tarif

A partir de 460,00 €

Durée

1j / 7h

Modes
  • Centre
  • Distance

Objectifs de la formation

  • Installer le serveur Web Apache sur différents systèmes d'exploitation.
  • Configurer le mode de fonctionnement d'Apache selon le système d'exploitation pour optimiser les performances.
  • Organiser la configuration dans les différents fichiers.
  • Réaliser la configuration de base d'Apache pour l'hébergement d'un site, et mettre en place une stratégie de délégation des tâches d'administration avec les fichiers .htaccess.
  • Configurer la journalisation des accès et des messages du serveur.
  • Gérer les permissions d'accès aux répertoires dans une démarche de sécurité optimale.
  • Mettre en place une stratégie de restriction d'accès par machine et par authentification utilisateur.
  • Gérer l'hébergement de multiples sites par la mise en place des hôtes virtuels.
  • Sécuriser les échanges entre les navigateurs et le serveur avec HTTPS.
Tarif

Contacter l'organisme

Durée

3j / 21h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation Programmation Salesforce Lightning, vous aurez acquis les connaissances et compétences nécessaires pour :

  • Développer des composants Lightning Web à utiliser dans de nombreuses expériences Salesforce
  • Travailler dans un environnement de développement Salesforce moderne à l'aide de Visual Studio Code, de Git et de la CLI Salesforce, en association avec un hub de développement et des organisations test
  • Communiquer entre les composants Lightning Web à l'aide d'événements personnalisés, de méthodes publiques et de publication/abonnement
  • Lire et écrire des données Salesforce en utilisant le wire service et Apex impératif
  • Modeler des composants Web Lightning avec CSS et SLDS
  • Construire des composants avancés à l'aide de composants de service, de localisation, de JavaScript tiers et d'API externes
  • Créer des formulaires à l'aide de composants standard et de contrôles personnalisés
  • Développer dans une organisation avec suivi de source et déployer dans des organisations sans suivi de source
Tarif

A partir de 3 625,00 €

Durée

5j / 35h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

À l'issue de cette formation AWS - Notions Techniques de base sur Amazon Web Services vous aurez acquis les connaissances et les compétences nécessaires pour :

  • Concept et histoire d'AWS
  • Infrastructure d'AWS : Compute, Storage, Networking
  • Sécurité, Identité et gestion des accès
  • Les bases de données sur AWS
  • Les outils de gestion d'AWS.
Tarif

A partir de 800,00 €

Durée

1j / 7h

Modes
  • Centre
  • Entreprise
  • Distance

Objectifs de la formation

  • Pendant la formation, le formateur évalue la progression pédagogique des participants via des QCM, des mises en situation et des travaux pratiques. Les participants passent un test de positionnement avant et après la formation pour valider leurs compétences acquises.
Tarif

Contacter l'organisme

Durée

16 jours (112 heures)

Modes
  • Distance
  • Centre

Objectifs de la formation

  • Mettre en oeuvre un site web avec Wordpress
  • Identifier les impératifs liés à la sécurité
  • Faire vivre le site au quotidien
Tarif

A partir de 1 390,00 €

Durée

2j / 14h

Modes
  • Centre
  • Entreprise
  • Distance

Je cherche à faire...