Scrapes products from retailer websites including product names, prices, categories, and availability.

## Goal
Visit the retailer URL I am going to give you and extract the relevant product and store information.

## Information I want you to extract:

- Product Name
- Product URL (full absolute URL to the product page)
- Brand Name (name of the brand the product is from)
- Price (in the displayed currency, e.g. $49.99)
- Sale Price (if a discount is shown, otherwise return "N/A")
- Product Category (e.g. Electronics, Clothing, Home & Garden)
- Availability (In Stock; Out of Stock; Limited Stock; Pre-Order)
- Rating (out of 5 stars, if displayed)
- SKU / Product ID (usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221")
- Image URL (absolute link to the main product image)

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- If prices include tax labels (e.g. "incl. VAT"), return the price without the label
- If a product has multiple variants (sizes, colors), return only the default/first displayed variant

## Additional Instructions:
- Navigate through category pages and product listings to find products
- SKU's are  usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221"
- Some retailers use lazy loading or infinite scroll, keep scrolling to load more products
- Do not extract promotional banners, ads, or non-product content
- Important: Do not extract anything else but the requested information

Slik bruker du denne AI-prompten

  1. Create a New Collection: Start med å opprette en ny, tom collection i Datablist der dataene skal lagres. Klikk '+ Create new collection' i sidepanelet.
AI web scraping > Vanlig web scraping
AI web scraping > Vanlig web scraping
  1. Select the AI Agent Source: Klikk "See all sources" eller gå til "Import" -> "Import From Data Sources". Velg "AI Agent - Site Scraper".
Velg AI Agent - Site Scraper
Velg AI Agent - Site Scraper
  1. Konfigurer Source:

    • Select Template: Finn og velg prompten fra "Template"-nedtrekksmenyen. Prompten over lastes inn automatisk.
    • URL to Scrape: Skriv inn URL-en du vil skrape
    • Enable Pagination (valgfritt): Hvis resultatene er på flere sider, huk av for Enable Pagination og sett en fornuftig Max Pages-grense (f.eks. 10).
    • Customize (valgfritt): Du kan justere AI-modellen (f.eks. GPT-4o mini er ofte kostnadseffektiv), redigere prompten for spesifikke behov, eller endre forventede Outputs.
AI web scraping > Vanlig web scraping
AI web scraping > Vanlig web scraping
  1. Review Outputs: Klikk Continue. Datablist viser output-feltene definert i prompten (Project Name, Client Company Name). Klikk +-ikonet ved siden av hvert for å opprette tilsvarende properties (kolonner) i samlingen din.
Outputs
Outputs
  1. Run Import: Klikk Run import now. AI Agent vil starte skraping av nettstedet basert på prompten og fylle samlingen din.

Priser

Denne datakilden bruker Datablist credits basert på forbruk. Kostnadene avhenger av nettstedets kompleksitet og antall sider som besøkes.

Test ved å kjøre AI Agent på én side først for å få et kostnadsestimat.

FAQ

Hvordan starte et nytt kjør med samme konfigurasjon?

Når du har kjørt AI Agent, klikk på den rosa knappen øverst til høyre i datatabellen for å åpne den igjen med dine sist brukte innstillinger.

Bruk dine eksisterende agent-innstillinger
Bruk dine eksisterende agent-innstillinger

Hva skjer hvis AI Agent prøver å få tilgang til et beskyttet nettsted eller blir blokkert?

AI Agent bruker automatisk proxy-servere ved behov for å få tilgang til nettsteder som kan ha scraping-beskyttelser eller geografiske begrensninger. Dette øker sjansen for vellykket datauttrekk, men svært tungt beskyttede nettsteder kan fortsatt være utfordrende.

Hvor mye data kan jeg behandle med AI Agent?

Når du kjører AI Agent (enten som en beriking eller en datakilde), kan Datablist-samlinger håndtere behandling for opptil 100 000 elementer (rader). For større datasett må du kanskje dele dataene i flere samlinger.

Hvordan er AI Agent forskjellig fra ChatGPT/Claude/Gemini-berikelsene?

De standard AI-berikingene (ChatGPT, Claude, Gemini) prosesserer data som allerede ligger i samlingen din ved å bruke AI-ens eksisterende kunnskap. AI Agent kan aktivt samhandle med det levende nettet—utføre Google-søk, bla gjennom nettsteder og hente ny informasjon basert på prompten din.

Hvor nøyaktige er resultatene?

Nøyaktigheten avhenger i stor grad av hvor tydelig og spesifikk prompten din er, samt oppgavens kompleksitet og informasjonen som er tilgjengelig på nettet. Å gi klare instrukser, eksempler og regler for håndtering av feil forbedrer resultatene. Datablist gir ofte en confidence score for AI Agent-outputs for å hjelpe med å vurdere pålitelighet.