Scrapes products from retailer websites including product names, prices, categories, and availability.

## Goal
Visit the retailer URL I am going to give you and extract the relevant product and store information.

## Information I want you to extract:

- Product Name
- Product URL (full absolute URL to the product page)
- Brand Name (name of the brand the product is from)
- Price (in the displayed currency, e.g. $49.99)
- Sale Price (if a discount is shown, otherwise return "N/A")
- Product Category (e.g. Electronics, Clothing, Home & Garden)
- Availability (In Stock; Out of Stock; Limited Stock; Pre-Order)
- Rating (out of 5 stars, if displayed)
- SKU / Product ID (usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221")
- Image URL (absolute link to the main product image)

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- If prices include tax labels (e.g. "incl. VAT"), return the price without the label
- If a product has multiple variants (sizes, colors), return only the default/first displayed variant

## Additional Instructions:
- Navigate through category pages and product listings to find products
- SKU's are  usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221"
- Some retailers use lazy loading or infinite scroll, keep scrolling to load more products
- Do not extract promotional banners, ads, or non-product content
- Important: Do not extract anything else but the requested information

Come usare questo AI Prompt

  1. Crea una nuova collezione: Inizia creando una nuova collezione vuota in Datablist dove verranno salvati i dati. Clicca su '+ Create new collection' nella sidebar.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Seleziona la fonte AI Agent: Clicca su "See all sources" oppure vai su "Import" -> "Import From Data Sources". Scegli "AI Agent - Site Scraper".
Seleziona AI Agent - Site Scraper
Seleziona AI Agent - Site Scraper
  1. Configura la fonte:

    • Select Template: Trova e scegli il prompt dal menu a tendina "Template". Il prompt qui sopra verr�e0 caricato automaticamente.
    • URL to Scrape: Inserisci l'URL da cui fare scraping
    • Enable Pagination (Opzionale): Se i risultati sono su pi�f9 pagine, seleziona Enable Pagination e imposta un Max Pages ragionevole (es. 10).
    • Customize (Opzionale): Puoi scegliere il modello AI (es. GPT-4o mini spesso �e8 conveniente), modificare il prompt per esigenze specifiche o cambiare gli Outputs previsti.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Rivedi gli Outputs: Clicca su Continue. Datablist mostrer�e0 i campi di output definiti nel prompt (Project Name, Client Company Name). Clicca sull'icona + accanto a ciascuno per creare le relative propriet�e0 (colonne) nella tua collezione.
Outputs
Outputs
  1. Esegui l'import: Clicca su Run import now. L'AI Agent inizier�e0 a fare scraping del sito in base al prompt e popoler�e0 la tua collezione.

Prezzi

Questa fonte dati utilizza i Datablist credits in base all'uso. I costi dipendono dalla complessit�e0 del sito e dal numero di pagine visitate.

Consiglio: esegui prima l'AI Agent su una singola pagina per stimare il costo.

FAQ

Come avviare un'altra esecuzione con la stessa configurazione?

Dopo aver eseguito il tuo AI Agent, clicca sul pulsante rosa in alto a destra della tua tabella dati per riaprirlo con le ultime impostazioni usate.

Usa le impostazioni esistenti del tuo agent
Usa le impostazioni esistenti del tuo agent

Cosa succede se l'AI Agent prova ad accedere a un sito protetto o viene bloccato?

L'AI Agent usa automaticamente server proxy quando necessario per accedere a siti che potrebbero avere protezioni anti-scraping o restrizioni geografiche. Questo aumenta le possibilit�e0 di estrazione dati con successo, anche se siti molto protetti possono comunque essere difficili.

Quanti dati posso processare con l'AI Agent?

Quando esegui l'AI Agent (come enrichment o come fonte dati), le collezioni Datablist possono gestire fino a 100.000 elementi (righe). Per dataset pi�f9 grandi, potresti dover dividere i dati in pi�f9 collezioni.

In cosa l'AI Agent �e8 diverso dagli enrichment ChatGPT/Claude/Gemini?

Gli enrichment AI standard (ChatGPT, Claude, Gemini) processano dati gi�e0 presenti nella tua collezione usando la conoscenza esistente dell'AI. L'AI Agent pu�f2 interagire attivamente con il web live eseguendo ricerche Google, navigando siti e estraendo nuove informazioni in base al tuo prompt.

Quanto sono accurati i risultati?

L'accuratezza dipende molto dalla chiarezza e specificit�e0 del tuo prompt, dalla complessit�e0 del task e dalle informazioni disponibili online. Fornire istruzioni chiare, esempi e regole per la gestione degli errori migliora i risultati. Datablist spesso fornisce un punteggio di confidenza per gli output dell'AI Agent per valutarne l'affidabilit�e0.