Extract business details from Yellow Pages including phone number, website URL, business name, and physical address.

Goal: I want to extract business details from Yellow Pages
===
What I want you to do: Visit the Yellow Pages URL I am going to give you and extract the relevant information.

## Information I want you to extract:

- Phone number
- YellowPages Detail Url (absolute url)
- Website URL
- Business name
- Business description
- Physical address

## Instructions
- In the case you don't find an information, keep the field empty.
- If not specified otherwise, the pagination is done using the "?page=X" url parameter
- Important: Do not extract anything else but the requested information.

Jak używać tego AI promptu

  1. Utwórz nową kolekcję: Zacznij od utworzenia nowej, pustej kolekcji w Datablist, w której zostaną zapisane dane. Kliknij „+ Create new collection” w panelu bocznym.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Wybierz źródło AI Agent: Kliknij „See all sources” lub przejdź do „Import” -> „Import From Data Sources”. Wybierz „AI Agent - Site Scraper”.
Wybierz AI Agent - Site Scraper
Wybierz AI Agent - Site Scraper
  1. Skonfiguruj źródło:

    • Select Template: Znajdź i wybierz prompt z listy „Template”. Powyższy prompt zostanie załadowany automatycznie.
    • URL to Scrape: Wprowadź URL do scrapingu
    • Enable Pagination (Optional): Jeśli wyniki są na kilku stronach, zaznacz Enable Pagination i ustaw rozsądny limit Max Pages (np. 10).
    • Customize (Optional): Możesz dopasować model AI (np. GPT-4o mini bywa korzystny kosztowo), edytować prompt pod konkretne potrzeby lub zmienić oczekiwane Outputs.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Review Outputs: Kliknij Continue. Datablist pokaże pola wyjściowe zdefiniowane w prompt (Project Name, Client Company Name). Kliknij ikonę + obok każdego, aby utworzyć odpowiednie właściwości (kolumny) w Twojej kolekcji.
Outputs
Outputs
  1. Run Import: Kliknij Run import now. AI Agent rozpocznie scraping strony zgodnie z promptem i zapełni Twoją kolekcję.

Cennik

To źródło danych korzysta z kredytów Datablist w modelu rozliczeń za użycie. Koszt zależy od złożoności strony i liczby odwiedzonych stron.

Przetestuj uruchomienie AI Agent najpierw na pojedynczej stronie, aby oszacować koszt.

FAQ

Jak uruchomić kolejne zadanie z tą samą konfiguracją?

Po uruchomieniu AI Agent kliknij różowy przycisk w prawym górnym rogu tabeli danych, aby otworzyć go ponownie z ostatnimi ustawieniami.

Użyj istniejących ustawień agenta
Użyj istniejących ustawień agenta

Co się stanie, jeśli AI Agent spróbuje uzyskać dostęp do chronionej strony lub zostanie zablokowany?

AI Agent automatycznie używa serwerów proxy, gdy to konieczne, aby dotrzeć do stron z zabezpieczeniami przed scrapingiem lub ograniczeniami geograficznymi. Zwiększa to szanse na skuteczną ekstrakcję danych, choć bardzo silnie chronione witryny nadal mogą stanowić wyzwanie.

Ile danych mogę przetworzyć za pomocą AI Agent?

Podczas uruchamiania AI Agent (zarówno jako wzbogacenie, jak i źródło danych) kolekcje Datablist mogą przetwarzać do 100 000 elementów (wierszy). W przypadku większych zbiorów danych możesz potrzebować podzielić je na kilka kolekcji.

Czym AI Agent różni się od wzbogaceń ChatGPT/Claude/Gemini?

Standardowe wzbogacenia AI (ChatGPT, Claude, Gemini) przetwarzają dane już znajdujące się w Twojej kolekcji, korzystając z istniejącej wiedzy AI. AI Agent potrafi aktywnie działać w sieci — wykonywać wyszukiwania w Google, przeglądać strony i pozyskiwać nowe informacje na podstawie Twojego promptu.

Jak dokładne są wyniki?

Dokładność w dużej mierze zależy od klarowności i precyzji Twojego promptu oraz złożoności zadania i dostępności informacji online. Dostarczenie jasnych instrukcji, przykładów i zasad obsługi błędów poprawia wyniki. Datablist często podaje ocenę pewności (confidence score) dla wyników AI Agent, aby pomóc ocenić wiarygodność.