Scrapes products from retailer websites including product names, prices, categories, and availability.

## Goal
Visit the retailer URL I am going to give you and extract the relevant product and store information.

## Information I want you to extract:

- Product Name
- Product URL (full absolute URL to the product page)
- Brand Name (name of the brand the product is from)
- Price (in the displayed currency, e.g. $49.99)
- Sale Price (if a discount is shown, otherwise return "N/A")
- Product Category (e.g. Electronics, Clothing, Home & Garden)
- Availability (In Stock; Out of Stock; Limited Stock; Pre-Order)
- Rating (out of 5 stars, if displayed)
- SKU / Product ID (usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221")
- Image URL (absolute link to the main product image)

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- If prices include tax labels (e.g. "incl. VAT"), return the price without the label
- If a product has multiple variants (sizes, colors), return only the default/first displayed variant

## Additional Instructions:
- Navigate through category pages and product listings to find products
- SKU's are  usually found in the product URL, e.g. "https://shop.example.com/products/SKN-40221" → SKU is "SKN-40221"
- Some retailers use lazy loading or infinite scroll, keep scrolling to load more products
- Do not extract promotional banners, ads, or non-product content
- Important: Do not extract anything else but the requested information

Jak używać tego AI promptu

  1. Utwórz nową kolekcję: Zacznij od utworzenia nowej, pustej kolekcji w Datablist, w której zostaną zapisane dane. Kliknij „+ Create new collection” w panelu bocznym.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Wybierz źródło AI Agent: Kliknij „See all sources” lub przejdź do „Import” -> „Import From Data Sources”. Wybierz „AI Agent - Site Scraper”.
Wybierz AI Agent - Site Scraper
Wybierz AI Agent - Site Scraper
  1. Skonfiguruj źródło:

    • Select Template: Znajdź i wybierz prompt z listy „Template”. Powyższy prompt zostanie załadowany automatycznie.
    • URL to Scrape: Wprowadź URL do scrapingu
    • Enable Pagination (Optional): Jeśli wyniki są na kilku stronach, zaznacz Enable Pagination i ustaw rozsądny limit Max Pages (np. 10).
    • Customize (Optional): Możesz dopasować model AI (np. GPT-4o mini bywa korzystny kosztowo), edytować prompt pod konkretne potrzeby lub zmienić oczekiwane Outputs.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Review Outputs: Kliknij Continue. Datablist pokaże pola wyjściowe zdefiniowane w prompt (Project Name, Client Company Name). Kliknij ikonę + obok każdego, aby utworzyć odpowiednie właściwości (kolumny) w Twojej kolekcji.
Outputs
Outputs
  1. Run Import: Kliknij Run import now. AI Agent rozpocznie scraping strony zgodnie z promptem i zapełni Twoją kolekcję.

Cennik

To źródło danych korzysta z kredytów Datablist w modelu rozliczeń za użycie. Koszt zależy od złożoności strony i liczby odwiedzonych stron.

Przetestuj uruchomienie AI Agent najpierw na pojedynczej stronie, aby oszacować koszt.

FAQ

Jak uruchomić kolejne zadanie z tą samą konfiguracją?

Po uruchomieniu AI Agent kliknij różowy przycisk w prawym górnym rogu tabeli danych, aby otworzyć go ponownie z ostatnimi ustawieniami.

Użyj istniejących ustawień agenta
Użyj istniejących ustawień agenta

Co się stanie, jeśli AI Agent spróbuje uzyskać dostęp do chronionej strony lub zostanie zablokowany?

AI Agent automatycznie używa serwerów proxy, gdy to konieczne, aby dotrzeć do stron z zabezpieczeniami przed scrapingiem lub ograniczeniami geograficznymi. Zwiększa to szanse na skuteczną ekstrakcję danych, choć bardzo silnie chronione witryny nadal mogą stanowić wyzwanie.

Ile danych mogę przetworzyć za pomocą AI Agent?

Podczas uruchamiania AI Agent (zarówno jako wzbogacenie, jak i źródło danych) kolekcje Datablist mogą przetwarzać do 100 000 elementów (wierszy). W przypadku większych zbiorów danych możesz potrzebować podzielić je na kilka kolekcji.

Czym AI Agent różni się od wzbogaceń ChatGPT/Claude/Gemini?

Standardowe wzbogacenia AI (ChatGPT, Claude, Gemini) przetwarzają dane już znajdujące się w Twojej kolekcji, korzystając z istniejącej wiedzy AI. AI Agent potrafi aktywnie działać w sieci — wykonywać wyszukiwania w Google, przeglądać strony i pozyskiwać nowe informacje na podstawie Twojego promptu.

Jak dokładne są wyniki?

Dokładność w dużej mierze zależy od klarowności i precyzji Twojego promptu oraz złożoności zadania i dostępności informacji online. Dostarczenie jasnych instrukcji, przykładów i zasad obsługi błędów poprawia wyniki. Datablist często podaje ocenę pewności (confidence score) dla wyników AI Agent, aby pomóc ocenić wiarygodność.