Il y a deux semaines, j'ai failli tomber malade en rédigeant un article sur comment scraper des produits sur un site e-commerce.

Voici pourquoi : j’ai tenté de collecter des produits sur le site GymShark avec un prompting framework pour la classification et l’édition de données que j’avais conçu pour les AI Assistants dans Datablist. Au départ, ça fonctionnait, mais les données n’étaient pas correctement triées, ce qui a rendu l’ensemble du dataset inutilisable.

C’est là que j’ai compris que chaque IA et chaque cas d’utilisation nécessitent des prompts différents.

Puisque dans le prompting, les petits détails font toute la différence, rater 5% des détails rendra vos résultats inutilisables.

C’est parti !

À retenir dans cet article :

  • Les agents IA de Datablist peuvent chercher sur Google, visiter des sites, appeler des API, et plus
  • Un bon prompt fait toute la différence avec un agent IA
  • Suivre les bonnes pratiques facilite la création de bons prompts pour les agents IA
  • Datablist fournit des modèles de prompts, mais apprendre à formuler reste essentiel

Les agents IA de Datablist & comparaison avec les AI Assistants

Pour bien distinguer le prompting pour un agent IA de celui pour un AI Assistant, il faut clarifier leurs capacités respectives.

Voici deux résumés simples de ce que ces outils peuvent faire :

AI Assistant

Les AI Assistants de Datablist sont conçus pour lire, classifier, extraire, éditer et générer du texte ou du code.

AI Agent

Les agents IA de Datablist sont des IA munies d’outils capables de faire des recherches Google, afficher du code HTML, naviguer sur plusieurs pages, appeler des API, visiter et analyser les résultats de Google News, des sites web, stores e-commerce, etc.

Les AI Assistants sont aussi très efficaces, mais différemment
Les AI Assistants sont aussi très efficaces, mais différemment

💡 Simple et intuitif

Imaginez les agents IA comme le système qui traite les données externes, et l’AI Assistant comme le système qui agit sur vos données déjà présentes dans votre collection Datablist.

Capacités de l’AI Agent Datablist

Pour rédiger un prompt efficace à l’agent IA, rappelons les outils et capacités à disposition :

  • Recherche Google
  • Recherche Google News
  • Extraction et génération de texte ou code
  • Récupération d’informations de compte
  • Visite de site web
  • Pagination sur un site
  • Rendu HTML
  • Appel d’API

Les 11 règles pour communiquer avec les agents IA dans Datablist

Une fois que vous avez intégré les capacités de l’AI Agent, il reste à respecter quelques règles aussi simples qu’essentielles pour garantir l’exactitude de vos résultats. Ces règles sont :

  1. Considérez votre prompt comme une feuille de route : guidez l’agent avec vos instructions, ne vous contentez pas d’un ordre.
  2. Commencez toujours par votre objectif, et contextualisez-le.
  3. Tagguez chaque section du prompt pour aider l’agent à distinguer clairement vos intentions et séparer chaque commande/action.
  4. Utilisez des commandes claires pour appeler les outils de l’agent IA, comme "search Google", "extract text", "get HTML code", etc.
  5. Marquez les outputs et fournissez des exemples précis, car ils serviront de base à la sortie.
  6. Indiquez où trouver l’information sur le site si vous scrapez quelque chose de précis.
  7. Utilisez des séparateurs (".===") entre les différentes parties du prompt pour le structurer.
  8. Mentionnez les erreurs à éviter afin que l’agent puisse s’en prémunir.
  9. Définissez la gestion des erreurs ou des données manquantes.
  10. Testez et itérez vos prompts ; ne blâmez pas l’agent IA si le prompt n’est pas optimal (je l’ai fait avant…).
  11. Indiquez systématiquement, à la fin, depuis quelle colonne l’agent doit extraire la donnée.

En appliquant ces conseils et bonnes pratiques, vous ferez des économies (crédits et temps) et gagnerez en efficacité lors des itérations sur vos prompts.

📘 Un bon prompt, tout change

L’agent IA fonctionne aussi sans ces règles, mais vos résultats seront nettement meilleurs si vous les appliquez, car la structure du prompt fait toute la différence.

Exemples de prompts pour agent IA : Bon vs Mauvais prompt

Prompt Agent IA : Bon exemple

Regardez d’abord le bon exemple de prompt, puis le mauvais !

C’est le prompt que j’ai rédigé récemment pour scraper des produits sur un site e-commerce.

Une analyse détaillée de mon bon prompt
Une analyse détaillée de mon bon prompt

Pourquoi est-ce un bon prompt ?

  1. Il commence par un objectif précis, bien défini, et contextualisé
  2. Le prompt est découpé en plusieurs sections bien taguées : c’est beaucoup plus compréhensible pour l’IA
  3. J’utilise des commandes explicites avec des verbes d’action
  4. Les actions s’enchaînent dans l’ordre logique
  5. Je précise ce que je cherche, exemples à l’appui
  6. J’indique comment gérer les exceptions ou incohérences
  7. Je liste les erreurs spécifiques à éviter
  8. Les parties sont délimitées avec ".==="
  9. Le prompt est bien structuré et dirige l’IA pas à pas
  10. Je fais le lien à la fin avec la colonne source des données

Prompt Agent IA : Mauvais exemple

Pour ceux qui pensent que je suis "le tech qui sait forcément tout faire", voici la vérité : je ne sais pas coder, et voici en prime à quoi ressemblaient mes premiers prompts !

Une analyse détaillée de mon mauvais prompt
Une analyse détaillée de mon mauvais prompt

Oui, certains pourraient y voir un prompt convenable, mais ce n’en est pas un –– car les résultats n’étaient pas bons du tout.

Dans cet exemple, beaucoup d’erreurs. Même si cela paraît sophistiqué, le prompt –– et donc les résultats –– sont inutiles. Voici ce qui n’allait pas et comment l’éviter :

Mauvais prompt raison #1 : Structure médiocre

Pas de logique claire ni d’organisation précise.

Pour l’éviter : Décomposez votre objectif en étapes claires, comme pour expliquer la tâche à quelqu’un. Par exemple :

  • D’abord, visitez le site web ;
  • Ensuite, cherchez la section produit ;
  • Enfin, extrayez le prix.

Mauvais prompt raison #2 : Tags pas explicites

Les labels et sections manquent de clarté.

Pour l’éviter : Utilisez un langage courant pour taguer vos sections. Au lieu de "Data Parameters", dites "Informations produit à extraire". Au lieu de "Input", dites "URLs des sites à traiter".

Mauvais prompt raison #3 : Outputs non structurés et exemples absents

Le format attendu n’est pas défini, manque d’exemples.

Pour l’éviter : Incluez systématiquement la structure de données attendue (sous forme de listes numérotées) et 2-3 exemples précis du type de résultats souhaités.

Exemple :

1. Nom du produit : Nike Air Max ; Adidas Ultraboost ; Puma RS-X ;
2. Prix : 120 $ ; 180 $ ; 110 $ ;
3. Couleur : Noir ; Blanc nuage ; Rouge intense ;
4. Taille : US 9 ; US 10.5 ; US 8 ;
5. Matière : Mesh & synthétique ; Primeknit ; Cuir & mesh ;

Mauvais prompt raison #4 : Pas de séquence claire

Les actions ne suivent pas de logique ordonnée.

Pour l’éviter : Formulez chaque étape comme si vous donniez des instructions à un ami – "Commence par ceci, puis cela".

Exemple :

1. Ouvre le site ;
2. Trouve la section des produits ;
3. Extrait les données

Les 3 erreurs les plus courantes avec les agents IA

Depuis mon arrivée chez Datablist.com, j’ai eu beaucoup d’appels utilisateurs intéressés par les agents IA. J’ai observé des motifs récurrents d’erreurs… évitez-les à tout prix !

  • Refuser le prompting : Certains attendent que l’IA comprenne d’elle-même ce qu’ils pensent. Vouloir économiser du temps mais refuser d’en investir sonne étrange… ne soyez pas comme ça !

  • Instructions trop vagues : Ne dites pas juste "récupère les infos produit" ; détaillez : "extrait le nom, le prix en USD et les tailles disponibles depuis la fiche produit".

  • Ignorer le traitement des erreurs : Votre prompt doit prévoir les cas de données manquantes ou de scénarios inattendus (ex : "si le prix n’est pas dispo, indique 'N/A'").

Savoir écrire de bons prompts est indispensable à l’ère de l’IA
Savoir écrire de bons prompts est indispensable à l’ère de l’IA

Combien de temps faut-il investir dans la rédaction de prompts

Demandez-vous quelle valeur vous apporte ce workflow, et combien de temps il vous fera gagner.

Personnellement, je passe beaucoup de temps à rédiger des prompts, pour moi et pour aider nos utilisateurs.

Quand j’utilise Grok, je ne passe pas 30 min sur chaque prompt : je fais une première demande, j’itère si besoin, car mes cas d’usage sont simples. Mais pour un prompt de personnalisation d’emails, ou de data cleaning, j’y accorde du temps, car cela m’épargne des heures de correction/itération ensuite !

Harrison Chase, Fondateur de LangChain : « Je pense qu’on n’a pas encore trouvé la meilleure manière d’interagir avec ces agent applications. Garder l’humain dans la boucle reste pour l’instant nécessaire, car ce n’est pas ultra fiable. Mais si l’humain intervient trop, ça n’a plus d’utilité. Il faut donc trouver le bon équilibre. »

Mon modèle de prompt pour agent IA à adapter (avec exemples)

Modèle à éditer selon vos cas d'usage, suivi de deux exemples concrets : Prenez bien le temps d’adapter chaque partie à votre besoin.

P.S. Ce framework m’a demandé des heures de travail… Profitez-en ! ;)

Modèle de prompt pour agent IA

Mon objectif : Détaillez votre objectif et le contexte de la mission.

===

Je veux que tu :
- Première étape de la tâche, par ex. faire une recherche Google
- Deuxième étape, par ex. extraire des informations

===

Informations à extraire (avec exemples) :
- Sortie 1 (Exemple 1, Exemple 2)
- Sortie 2 (Exemple 1, Exemple 2)
- Sortie 3 (Exemple 1, Exemple 2)

===

Gestion des incohérences :
- Anticipez erreurs/incohérences possibles et indiquez comment les traiter

===

Erreurs à éviter :
- Listez les erreurs classiques qu’un stagiaire ferait le premier jour

===

Mentionnez ici le nom de votre input : utilisez un / pour référencer une colonne dans votre collection

Application de mon framework à un scraping e-commerce :

Prompt Agent IA pour scraping e-commerce

Mon objectif : J’ai une liste de sites e-commerce dont je veux extraire des infos produit précises.

===

Je veux que tu :
- Visite chaque site web dont je te donnerai le lien
- Pour chaque produit, extrais les infos que je détaillerai juste après

===

Ce que j’attends (avec exemples) :
- Nom du produit (Traveler XP 300)
- Prix affiché dans la devise locale ($30 ; €10)
- Catégorie du produit (Sac à dos voyage ; Sac business)
- Spécificité produit 1 (30L ; 17.4×14.3×8)
- Spécificité produit 2 (Noir ; 11 compartiments)
- Tags spéciaux (Dernière chance ; Offre limitée)

===

Gestion des incohérences :
- Une seule info par type attendue
- Note "N/A" si la donnée est absente

===

Erreurs à éviter :
- Ne remonte rien en dehors des types listés (pas d’appel à l’action, pas d’avis, etc.)
- Les pages ne sont pas toutes structurées pareil mais les produits sont suffisamment différenciés pour reconnaître les infos-clés

===

Sites à scraper : /Category Pages

Application à une recherche presse/media :

Prompt Agent IA pour veille médias

Mon objectif : Retrouver les mentions presse récentes de personnes précises à partir de leur nom et entreprise.

===

Instructions de la tâche :
- Cherche sur Google les articles presse/actus pour chaque personne
- Visite les sites mentionnant la personne recherchée
- Extrais les informations suivantes sur ces mentions

===

Informations à extraire (avec exemples) :
- Titre de l’article ("John Smith lance une startup tech")
- Nom du média (The Tech Times)
- Date de publication (2025-05-20)
- Type de mention (Interview, Revue, Communiqué de presse)

===

Règles de gestion de données :
- Ne garde que la mention la plus récente (sur 3 mois)
- Indique "Pas de mention récente" si aucune actu presse sur 3 mois

===

Erreurs à éviter :
- Ignore les réseaux sociaux
- Ne confonds pas les homonymes ; croise systématiquement "nom complet + nom de l’entreprise"
- Ignore les pubs/sponso
- Vérifie que la publication date bien de la période demandée

===

Nom complet de la personne : /People to Research

===

Nom de l’entreprise : /company name

Foire aux questions sur la rédaction de prompts pour l’IA

1. Dois-je vraiment passer du temps à écrire mes prompts ?

Même si cela paraît un peu laborieux, investir ce temps est essentiel pour obtenir de bons résultats. Des instructions floues donnent des résultats imprécis et vous coûteront plus d’heures en modifications/corrections.

2. Qu'est-ce qui distingue un « bon » d’un « mauvais » prompt ?

Un bon prompt est structuré, avec une consigne claire, des exemples d’output précis et des consignes de gestion des erreurs. Un mauvais prompt est vague, sans structure, sans exemples, et ne prévoit pas d’imprévus.

3. Y a-t-il un modèle simple à suivre ?

Oui ! Cet article vous propose un template en cinq parties : Objectif, Consignes tâche, Informations à extraire, Règles de gestion de données, Erreurs à éviter — chaque partie doit être séparée par ===

4. À quel point mes exemples doivent-ils être détaillés dans le prompt ?

Les exemples doivent être précis et couvrir plusieurs cas. Par exemple, si vous scrapez des produits, donnez des formats, devises, ou tailles différentes parmi vos exemples.

5. Quelle est la partie la plus importante d’un prompt à ne surtout pas oublier ?

La gestion des erreurs et la section « Erreurs à éviter ». Elles vous évitent bien des soucis et garantissent des résultats homogènes même en cas d’information absente ou de cas particulier.