[Tuto Français] Comment Scraper un Site Web de 2ème Niveau avec Python (Proxy, Clean Data, Excel)

• Comment Scraper des Fiches Détaillées avec httpx et selectolax ?
• Comment Naviguer et Scraper plusieurs pages ?
• Comment Nettoyer ses Données (avec Pandas) ?
• Comment Utiliser des Proxies pour Scraper en toute Sécurité (avec Bright Data) ?
• Comment Sauvegarder les Données dans un Fichier Excel ?
Pour utiliser les Proxies sur Bright Data (avec $10 de crédits gratuits) :
brdta.com/francoisdufaurboidin
Pour obtenir vos 100 premiers leads B2B offerts:
scrap.id/s/1xY
Pour une demande en Web Scraping:
fdufaurboidin@gmail.com
Créer un Environnement Virtuel --- 01:55
"Brouillon" (html, loop item & pagination) --- 03:51
Créer une Fonction "Main" --- 14:35
Créer une Fonction pour le HTML --- 15:34
Arrêter la Pagination lorsque la Dernière Page est atteinte --- 19:14
Scraper les URLs --- 22:24
Naviguer sur les Fiches Détaillées --- 26:00
Extraire les Données --- 29:38
Nettoyer les Données (avec Pandas) --- 45:14
Sauvegarder les Données sur Excel --- 55:40
Utiliser des Proxies (avec Bright Data) --- 57:29
Quelques Suggestions --- 1:03:21

Пікірлер: 22

  • 7 ай бұрын

    Pour obtenir vos 100 premiers leads B2B offerts: scrap.id/s/1xY Pour une demande en Web Scraping: fdufaurboidin@gmail.com Pour utiliser les Proxies sur Bright Data (avec $10 de crédits gratuits) : brdta.com/francoisdufaurboidin

  • @alain.vetois2295
    @alain.vetois22956 ай бұрын

    Bonjour. Toujour aussi simple et detaillé dans les commentaires bravo pour les video sur le scraping.

  • 6 ай бұрын

    Bonjour, Je vous remercie.

  • @urbanrage1069
    @urbanrage10697 ай бұрын

    très bonne présentation, je ne pense pas que l'on peut le faire aussi facilement en PHP je vais regarder tes autres vidéos

  • 7 ай бұрын

    Faites-vous plaisir.

  • @claudedufaur1012
    @claudedufaur10127 ай бұрын

    Très bon travail.

  • @loicbarel9052
    @loicbarel90527 ай бұрын

    Très bel épi ! Je m'abonne !

  • 7 ай бұрын

    Des années d'expérience !

  • @loicbarel9052

    @loicbarel9052

    7 ай бұрын

    @ A part ça la vidéo etait cool ! J'ai appris des choses. Quand je faisais du scraping j'utilisais pas ces modules

  • @aldricv
    @aldricv7 ай бұрын

    Pour un mec qui a vécu à Lille quelques années, donc près du siège de Décathlon , la marque BTWIN se prononce "between" 😉

  • 7 ай бұрын

    Merci pour l'info ;)

  • @christinel8347
    @christinel83474 ай бұрын

    Bonjour, votre vidéos est intéressante et d'un point de vue pédagogique, c'est une approche qui permet aux débutants d'aborder le webscraping alors bravo ! Pour vérifier le nombre d'élement trouvés avec le selecteur CSS, je trouve pertinent de comparer en utilisant un autre fichier avec bs4 pour dénombrer automatiquement les cases trouvées. Personnellement, à devoir compter "manuellement" on peut faire une erreur, tandis que la machine va se baser sur le code : plus rapide selon moi et plus fiable. Merci pour la vidéo, c'est intéressant, j'aurais fait une amélioration sur le code avec une boucle automatique pour récupérer toutes les url des pages et un système d'arrêt automatique avec critères, cela pour éviter tout problème de nombre de pages : ici dans la fonction RANGE, le pas est limité jusqu'à 10 pages. bonne continuation, continuez ainsi car au niveau pédagogique, je trouve que vos vidéos peuvent servir de base pour des cours.

  • 4 ай бұрын

    Bonjour Christine, Merci pour vos axes d'amélioration.

  • @Bilalrajput2001
    @Bilalrajput20015 ай бұрын

    Could you please remake this video in English?

  • 5 ай бұрын

    If you pay me $500, I will do it.

  • @leopouzet5249

    @leopouzet5249

    2 ай бұрын

    🤣🤣🤣🤣🤣

  • @PelletsEaseFrance
    @PelletsEaseFrance7 ай бұрын

    ce ne serait pas plus simple avec le sitemap?

  • 7 ай бұрын

    Possible mais ce n'est pas sûr. Il y a un sitemap pour les produits mais il faut filtrer les URLs pour les vélos. Et le sitemap n'est pas disponible sur tous les sites.

  • @PelletsEaseFrance

    @PelletsEaseFrance

    7 ай бұрын

    @ j'ai la chance qu'il y a un sitemap sur les sites qui m'intéressent. As-tu déja essayé playwright pour python?

  • 7 ай бұрын

    @@PelletsEaseFrance Non, jamais. Peut-être un jour.

  • @PelletsEaseFrance

    @PelletsEaseFrance

    7 ай бұрын

    @ Bonne journée et merci pour cette sympathiques vidéo. Est-ce que un site du genre Decathlon est à la portée d'une petite entreprise? Des scripts open sources de ce genre là existent?

  • 7 ай бұрын

    @@PelletsEaseFrance Pour les scripts, je ne ne sais pas. Mais ça semble possible en termes de scraping