Tesco ne propose pas d’API publique pour ses produits. C’est pourquoi la plupart des équipes qui veulent scraper les produits Tesco finissent soit par payer plus de 2 000 £ à un freelance, soit par brancher un scraper Apify qui casse au bout de quelques jours.

Ce que beaucoup ignorent, c’est qu’il existe une troisième voie : le AI scraping. Cette approche lit la page comme un humain, ce qui permet à la même configuration de fonctionner sur une catégorie Tesco, une page de marque ou une page de promotions, tout en résistant aux changements de mise en page qui font tomber les scrapers classiques.

Dans ce guide, vous allez voir tout le process : pourquoi créer un scraper Tesco sur mesure n’est pas un bon investissement, quelles pages Tesco renvoient les données les plus propres, et un pas-à-pas complet avec le AI Scraping Agent de Datablist.

📌 Résumé pour aller à l’essentiel

Cet article explique comment scraper les données produits de Tesco avec l’AI Scraping Agent de Datablist.

Le problème : Tesco n’a pas d’API publique pour ses produits, les scrapers prêts à l’emploi cassent quelques semaines après chaque changement de layout, et une solution sur mesure coûte plus de 2 000 £, sans compter la maintenance.

La solution : utiliser l’AI Scraping Agent de Datablist pour scraper les produits Tesco avec un prompt en anglais simple et une seule URL.

Ce que vous allez apprendre :

  1. Pourquoi un scraper Tesco sur mesure devient vite un gouffre financier
  2. Quelles pages Tesco donnent les données les plus propres
  3. Une méthode en 5 étapes pour scraper n’importe quelle catégorie Tesco en moins de 10 minutes

Pourquoi Datablist :

  1. L’AI scraping comprend le sens, pas seulement le HTML, donc les mises à jour du site Tesco ne cassent pas l’extraction
  2. La pagination est gérée automatiquement (jusqu’à 5 000 pages par run)
  3. Aucun code, aucune clé API : juste une URL Tesco et un prompt

Ce que couvre ce guide

Pourquoi créer un scraper Tesco sur mesure n’en vaut pas la peine

Si vous avez déjà envisagé de développer votre propre scraper Tesco, voici trois bonnes raisons de reconsidérer l’idée avant de dépenser le moindre centime.

C’est coûteux

Un scraper Tesco fiable ne se construit pas en un week-end. Tesco.com charge sa grille produits de façon dynamique avec JavaScript, répartit la pagination sur des centaines de pages de catégories, et modifie son interface assez souvent pour qu’un scraper basé sur des règles doive être corrigé en permanence.

Voici ce que la plupart des équipes essaient, et pourquoi chaque option finit par coincer :

  • Faire appel à un développeur freelance : plus de 2 000 £ pour la première version, puis des frais supplémentaires à chaque fois que Tesco modifie sa grille
  • Acheter un scraper Tesco déjà prêt sur Apify ou GitHub : ça fonctionne au premier jour, puis ça casse quelques semaines après le prochain changement de layout
  • Coder rapidement un script Puppeteer ou Playwright : la pagination Tesco, le rendu JavaScript et les cartes produit irrégulières le mettent vite en défaut

Si vous avez seulement besoin d’un snapshot ponctuel, un freelance peut suffire. Mais si vous avez besoin de données Tesco fraîches de manière récurrente (suivi des prix, analyse FMCG, retail arbitrage), les coûts de maintenance s’accumulent mois après mois.

Comment scraper les produits Tesco - Coût des scrapers sur mesure
Comment scraper les produits Tesco - Coût des scrapers sur mesure

C’est long à mettre en place

Même avec un très bon développeur, créer un scraper Tesco propre prend plusieurs semaines. Il faut cartographier chaque page catégorie, gérer le HTML rendu, écrire la logique de pagination pour les grilles, et prévoir les cas où Tesco renvoie "N/A" pour les prix promotionnels ou masque certains produits derrière des restrictions d’âge.

L’AI Scraping Agent de Datablist évite toute cette phase de développement. Vous pouvez coller une URL Tesco et récupérer des données produits structurées en moins de 10 minutes. Pas de documentation technique à rédiger, pas d’allers-retours sur les edge cases, pas d’attente pour une v2.

Comment scraper les produits Tesco - Temps nécessaire pour créer un scraper
Comment scraper les produits Tesco - Temps nécessaire pour créer un scraper

Ça casse en permanence

C’est là que se cache le vrai coût : Tesco met régulièrement à jour sa grille produits. À chaque nouvelle version de template de catégorie ou dès qu’un élément de prix est déplacé, votre scraper Tesco sur mesure cesse de fonctionner.

Vous vous retrouvez alors avec deux options : repayer le développeur ou passer votre après-midi à déboguer.

L’AI scraping contourne ce problème. Comme l’AI Agent lit le sens de la page plutôt que sa structure HTML, un prix reste un prix même si Tesco change la classe CSS qui l’entoure.

💡 La vraie différence

Les scrapers traditionnels suivent des règles : « trouver l’élément avec la classe .product-price et extraire le texte ». Les scrapers IA suivent le sens : « trouver le prix du produit sur cette page Tesco ».

C’est pour cela que la même configuration qui fonctionne sur Tesco aujourd’hui continue de fonctionner après une réorganisation de la grille le mois prochain, et qu’elle se transpose facilement à Morrisons, Sainsbury's et Asda sans code spécifique par site.

Comment scraper les produits Tesco avec l’AI Agent de Datablist

Avant de passer au pas-à-pas, voici rapidement ce qu’est l’AI Scraping Agent, quelles pages Tesco donnent les résultats les plus propres, quelles données vous pouvez extraire, et où se situent les limites.

Qu’est-ce que l’AI Scraping Agent de Datablist ?

Datablist est une plateforme d’automatisation de workflows conçue pour créer des listes de leads, enrichir des données et exécuter des workflows de scraping. Dans Datablist, vous avez accès à plus de 60 sources et enrichissements, et l’AI Scraping Agent est celui qu’il faut utiliser pour extraire des données produits depuis le site d’un retailer.

L’agent repose sur trois éléments : une URL cible, un prompt qui décrit ce qu’il faut extraire, et un modèle de langage qui lit la page comme vous le feriez.

Pour scraper Tesco, vous n’avez même pas besoin d’écrire le prompt vous-même. Datablist inclut un template Retail Product Scraper qui précharge le prompt et les colonnes de sortie. Vous collez une URL Tesco, et le template s’occupe du reste.

Trois points importants sur la façon dont l’agent gère Tesco :

  • OpenAI GPT 4.1 mini par défaut, le meilleur LLM en rapport qualité/prix pour l’AI scraping
  • Support de Render HTML, indispensable pour Tesco puisque la grille produits se charge via JavaScript
  • Pagination automatique jusqu’à 5 000 pages par run

C’est aussi ce qui permet de réutiliser la même configuration sur d’autres supermarchés britanniques. Le même agent, le même template et les mêmes réglages fonctionnent sur Morrisons, Sainsbury's et Asda. Seule l’URL change.

La règle la plus importante : uniquement les pages de marque et de catégorie

Scrapez toujours des pages catégorie ou marque Tesco, jamais la page d’accueil ni une vue « all products ». Les listes trop longues dépassent la fenêtre de contexte de l’AI Agent, le run s’interrompt en cours de route sans possibilité de reprise, et vos crédits sont gaspillés.

Ce que l’AI Agent gère proprement sur Tesco :

  • ✅ Les pages catégorie sur tesco.com//...
  • ✅ Les pages marque (listings d’un fabricant donné)
  • ✅ Les pages de deals ou d’offres

Ce qu’il vaut mieux éviter :

  • ❌ La page d’accueil de Tesco
  • ❌ Les vues « all products » ou les résultats de recherche sur tout le site
  • ❌ Toute page qui charge des milliers de produits dans un infinite scroll unique

Quelles données peut-on extraire depuis Tesco ?

Un seul run Tesco peut extraire tous les champs produits dont vous avez besoin pour le suivi des prix, la veille concurrentielle ou le data enrichment d’un catalogue existant :

  • Product Name : intitulé complet du produit tel qu’affiché sur le site Tesco
  • Product URL : lien direct vers la fiche produit sur tesco.com
  • Brand Name : marque ou fabricant du produit
  • Price : prix actuel en GBP, avec le symbole £
  • Sale Price : prix remisé si une promotion Tesco est active, « N/A » s’il n’y a pas d’offre
  • Product Category : rayon ou catégorie du produit
  • Availability : en stock, rupture de stock ou disponibilité limitée
  • Rating : note client lorsqu’elle est affichée par Tesco
  • Image URL : lien direct vers l’image principale du produit
  • SKU : identifiant produit interne de Tesco

Choisissez les sorties dont vous avez réellement besoin avant de lancer le run, afin que l’export ne contienne que les colonnes utiles.

Scraper Tesco : le pas-à-pas complet

La configuration complète pour scraper Tesco se fait en 5 étapes. Avant de commencer, assurez-vous d’avoir :

  1. Une URL Tesco de catégorie ou de marque (pas la page d’accueil)
  2. Une idée assez claire des champs produits dont vous avez besoin

Étape 1 : créez un compte et une Collection

Commencez par créer un compte sur Datablist.com.

Comment scraper les produits Tesco - Page d’accueil Datablist
Comment scraper les produits Tesco - Page d’accueil Datablist

Ensuite, créez une New Collection.

Comment scraper les produits Tesco - Nouvelle collection
Comment scraper les produits Tesco - Nouvelle collection

Étape 2 : accédez à l’AI Scraping Agent

  1. Cliquez sur See all sources
Comment scraper les produits Tesco - Voir toutes les sources
Comment scraper les produits Tesco - Voir toutes les sources
  1. Descendez dans la liste, puis sélectionnez AI Scraping Agent (Site Scraper).
Comment scraper les produits Tesco - Sélection de l’AI Agent
Comment scraper les produits Tesco - Sélection de l’AI Agent

Vous devriez maintenant voir l’interface de configuration de la source, qui ressemble à ceci :

Comment scraper les produits Tesco - Paramètres de la source
Comment scraper les produits Tesco - Paramètres de la source

Étape 3 : sélectionnez le template Retail Product Scraper et collez une URL Tesco

  1. Cliquez sur le Template Drop-Down puis sélectionnez « Retail Product Scraper »
Comment scraper les produits Tesco - Sélection du template
Comment scraper les produits Tesco - Sélection du template
  1. Collez l’URL de votre catégorie Tesco dans le champ URL, par exemple :

https://www.tesco.com/groceries/en-GB/shop/fresh-food/all

Comment scraper les produits Tesco - Configuration de l’URL
Comment scraper les produits Tesco - Configuration de l’URL

❗️ Uniquement les pages de marque et de catégorie (rappel)

Ne collez jamais la page d’accueil Tesco ni une URL « all products ». Les grandes listes dépassent la fenêtre de contexte de l’AI Agent. Scrapez Tesco catégorie par catégorie.

  1. Réglez le nombre de pages à scraper (Tesco affiche généralement environ 36 produits par page, donc une catégorie de 200 produits nécessite environ 3 à 4 pages)
Comment scraper les produits Tesco - Paramètres de pagination
Comment scraper les produits Tesco - Paramètres de pagination
  1. Faites défiler vers le bas puis cliquez sur Continue
Comment scraper les produits Tesco - Paramètres avancés
Comment scraper les produits Tesco - Paramètres avancés

💡 Vérifiez vos paramètres avancés avant de cliquer sur Continue

Assurez-vous que les options suivantes sont bien activées :

  1. LLM : OpenAI GPT 4.1 mini (meilleur rapport performance/prix)
  2. Max Iterations : 10
  3. Website Scraper Option: Render HTML (critique pour Tesco, puisque le site charge sa grille produits dynamiquement via JavaScript)

Étape 4 : configurez les outputs

Datablist crée automatiquement les propriétés de sortie.

Cliquez sur les icônes X pour retirer les outputs dont vous n’avez pas besoin (par exemple, supprimez Rating si vous faites uniquement du suivi de prix Tesco).

Comment scraper les produits Tesco - Configuration des outputs
Comment scraper les produits Tesco - Configuration des outputs

Étape 5 : lancez le run

Une fois vos outputs configurés, cliquez sur Run Import Now pour démarrer le scraping Tesco.

Comment scraper les produits Tesco - Lancer l’import
Comment scraper les produits Tesco - Lancer l’import

Après quelques minutes, vos résultats Tesco ressembleront à ceci. À partir de là, les fonctions d’automatisation de workflow de Datablist peuvent nettoyer, dédupliquer et exporter les données.

Comment scraper les produits Tesco - Aperçu des résultats
Comment scraper les produits Tesco - Aperçu des résultats

💡 Évitez les doublons lors des runs Tesco répétés

Si vous prévoyez de scraper à nouveau la même catégorie Tesco plus tard :

  1. Choisissez une colonne d’identifiant unique (Product URL est le meilleur choix)
  2. Cliquez sur l’en-tête de colonne → Rename - Settings - Delete
  3. Cochez : Do not allow duplicate values
  4. Cliquez sur Save Property

Si vous récupérez aussi des données depuis Morrisons, Sainsbury's et Asda dans le même fichier, notre guide sur la suppression des doublons dans un fichier CSV explique comment faire une déduplication multi-retailers.

L’AI Agent de Datablist fonctionne aussi sur d’autres sites de retailers

La configuration Tesco n’est pas spécifique à Tesco. Le même AI Scraping Agent et le même template Retail Product Scraper fonctionnent sur tous les supermarchés britanniques que nous avons testés. Seule l’URL change.

Si vous récupérez aussi des données produits depuis un retailer similaire, consultez les guides pas à pas ci-dessous :

  1. Scraper les produits de Morrisons 👈🏽
  2. Scraper les produits de Sainsbury's 👈🏽
  3. Scraper les produits de Asda 👈🏽

Ce qu’il faut retenir

  1. Un scraper Tesco sur mesure est un gouffre financier. Le coût de départ dépasse 2 000 £, la maintenance vient s’ajouter, et les mises à jour de Tesco le feront casser régulièrement.
  2. L’AI scraping comprend le sens, pas le HTML. C’est pour cela que la même configuration continue de scraper les produits Tesco même après un changement de grille, et qu’elle se transpose à Morrisons, Sainsbury's et Asda sans code spécifique.
  3. Scrapez toujours des pages de marque ou de catégorie, jamais la page d’accueil. Les grosses listes dépassent la fenêtre de contexte de l’agent et gaspillent le run.
  4. La configuration complète prend moins de 5 minutes. Template, URL, outputs, run.

FAQ sur le scraping de Tesco

Combien coûte le scraping des produits Tesco ?

L’AI Agent de Datablist fonctionne avec un système de crédits basé sur l’usage. Le coût d’un run Tesco dépend du nombre de produits et de pages traités par l’agent. Les offres Datablist démarrent à 25 $/mois avec 5 000 crédits inclus, et les packs de recharge commencent à 20 $ pour 20 000 crédits, avec des remises allant jusqu’à 35 % sur les plus gros volumes.

Combien de temps faut-il pour scraper l’ensemble du catalogue Tesco ?

La plupart des pages catégorie Tesco contenant 50 à 200 produits sont scrapées en 5 à 10 minutes. Les runs plus importants sur plusieurs catégories paginées (500+ produits) peuvent prendre 10 à 20 minutes. La première configuration ajoute généralement 2 à 3 minutes.

Pourquoi scraper une page catégorie Tesco plutôt qu’une vue « all products » ?

Une vue Tesco « all products » charge des milliers d’articles dans une seule page rendue. Cela dépasse la fenêtre de contexte de l’AI Agent, l’agent s’arrête en cours de route, et il n’existe pas d’option de reprise : le run partiel est donc perdu. Les pages catégorie et marque restent dans une plage sûre, se scrapent proprement, puis peuvent être fusionnées dans une même Collection si vous avez besoin d’une couverture complète.

Puis-je scraper les prix promotionnels et les offres Tesco ?

Oui. Le template Retail Product Scraper inclut un output Sale Price. Lorsqu’une promotion Tesco est active, le prix remisé est extrait. Lorsqu’aucune offre n’est en cours, la colonne renvoie « N/A », ce qui reste très utile pour filtrer les produits en promotion par catégorie.

Le scraping de données produits Tesco visibles publiquement (noms, prix, disponibilité) est généralement légal au Royaume-Uni, selon les mêmes principes que pour les autres données web publiques. Vous devriez malgré tout consulter les conditions d’utilisation de Tesco, éviter toute donnée personnelle et rester dans des volumes de requêtes raisonnables. Pour un usage commercial, mieux vaut valider cela avec votre équipe juridique.

Tesco bloque-t-il les scrapers ?

Les protections anti-bot de Tesco sont en général assez modérées pour un site de retailer public. La plupart des runs Tesco via Datablist réussissent du premier coup, surtout lorsque l’option Render HTML est activée. Si une page catégorie ne renvoie pas de données, réduisez le nombre de pages et réessayez, ou découpez l’extraction en sous-catégories plus précises.

Puis-je programmer des runs récurrents pour suivre les prix Tesco ?

Oui. Les fonctions d’automatisation de workflow de Datablist vous permettent de mettre en place des runs récurrents. Associez cela à une colonne d’identifiant unique (Product URL est le meilleur choix) et au paramètre anti-doublons, afin que chaque nouveau run Tesco n’ajoute que les nouveaux produits au lieu de dupliquer les existants.

Puis-je scraper Tesco sans compétences techniques ?

Aucune compétence technique n’est nécessaire. Tout le process est no-code : sélectionnez le template Retail Product Scraper, collez une URL Tesco, choisissez vos outputs, puis lancez le run. Si vous savez écrire une phrase, vous pouvez scraper Tesco avec Datablist.

Quelles catégories Tesco fonctionnent le mieux pour le scraping ?

Les catégories alimentaires standard sur tesco.com renvoient les données les plus propres : produits frais, surgelés, boulangerie, boissons, entretien de la maison. Les pages marque fonctionnent également très bien. Les pages promo ou « Last chance » peuvent être un peu plus bruitées, car les cartes produit y mélangent plusieurs formats, mais l’AI Agent en extrait malgré tout des données exploitables.

L’AI Agent gère-t-il automatiquement la pagination sur Tesco ?

Oui. Lorsque Enable Pagination est activé, l’AI Agent parcourt chaque page de la catégorie Tesco jusqu’à la limite configurée (10 par défaut, 5 000 au maximum). Pour une catégorie Tesco de 240 produits affichant 36 articles par page, réglez la pagination sur 10 et l’agent récupérera l’ensemble de la liste.

Qu’est-ce que l’AI scraping ?

L’AI scraping est une méthode d’extraction de données structurées depuis des sites web à l’aide d’un modèle de langage, plutôt qu’avec des règles HTML figées. L’agent visite une page, lit son contenu, puis renvoie les champs demandés en anglais naturel. C’est précisément ce qui le rend robuste sur des sites comme Tesco, qui modifient souvent leur interface.

Quelle différence entre l’AI scraping et le web scraping traditionnel ?

Les scrapers traditionnels suivent des règles fixes (sélecteurs CSS, XPath). Quand le site change, ces règles cassent. L’AI scraping comprend le sens de la page, donc un prix Tesco reste un prix Tesco même après une modification du markup. C’est pour cela que la même configuration Datablist fonctionne sur Morrisons, Sainsbury's et Asda sans code spécifique par site.