Extract business details from Yellow Pages including phone number, website URL, business name, and physical address.

Goal: I want to extract business details from Yellow Pages
===
What I want you to do: Visit the Yellow Pages URL I am going to give you and extract the relevant information.

## Information I want you to extract:

- Phone number
- YellowPages Detail Url (absolute url)
- Website URL
- Business name
- Business description
- Physical address

## Instructions
- In the case you don't find an information, keep the field empty.
- If not specified otherwise, the pagination is done using the "?page=X" url parameter
- Important: Do not extract anything else but the requested information.

Come usare questo AI Prompt

  1. Crea una nuova collezione: Inizia creando una nuova collezione vuota in Datablist dove verranno salvati i dati. Clicca su '+ Create new collection' nella sidebar.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Seleziona la fonte AI Agent: Clicca su "See all sources" oppure vai su "Import" -> "Import From Data Sources". Scegli "AI Agent - Site Scraper".
Seleziona AI Agent - Site Scraper
Seleziona AI Agent - Site Scraper
  1. Configura la fonte:

    • Select Template: Trova e scegli il prompt dal menu a tendina "Template". Il prompt qui sopra verr�e0 caricato automaticamente.
    • URL to Scrape: Inserisci l'URL da cui fare scraping
    • Enable Pagination (Opzionale): Se i risultati sono su pi�f9 pagine, seleziona Enable Pagination e imposta un Max Pages ragionevole (es. 10).
    • Customize (Opzionale): Puoi scegliere il modello AI (es. GPT-4o mini spesso �e8 conveniente), modificare il prompt per esigenze specifiche o cambiare gli Outputs previsti.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Rivedi gli Outputs: Clicca su Continue. Datablist mostrer�e0 i campi di output definiti nel prompt (Project Name, Client Company Name). Clicca sull'icona + accanto a ciascuno per creare le relative propriet�e0 (colonne) nella tua collezione.
Outputs
Outputs
  1. Esegui l'import: Clicca su Run import now. L'AI Agent inizier�e0 a fare scraping del sito in base al prompt e popoler�e0 la tua collezione.

Prezzi

Questa fonte dati utilizza i Datablist credits in base all'uso. I costi dipendono dalla complessit�e0 del sito e dal numero di pagine visitate.

Consiglio: esegui prima l'AI Agent su una singola pagina per stimare il costo.

FAQ

Come avviare un'altra esecuzione con la stessa configurazione?

Dopo aver eseguito il tuo AI Agent, clicca sul pulsante rosa in alto a destra della tua tabella dati per riaprirlo con le ultime impostazioni usate.

Usa le impostazioni esistenti del tuo agent
Usa le impostazioni esistenti del tuo agent

Cosa succede se l'AI Agent prova ad accedere a un sito protetto o viene bloccato?

L'AI Agent usa automaticamente server proxy quando necessario per accedere a siti che potrebbero avere protezioni anti-scraping o restrizioni geografiche. Questo aumenta le possibilit�e0 di estrazione dati con successo, anche se siti molto protetti possono comunque essere difficili.

Quanti dati posso processare con l'AI Agent?

Quando esegui l'AI Agent (come enrichment o come fonte dati), le collezioni Datablist possono gestire fino a 100.000 elementi (righe). Per dataset pi�f9 grandi, potresti dover dividere i dati in pi�f9 collezioni.

In cosa l'AI Agent �e8 diverso dagli enrichment ChatGPT/Claude/Gemini?

Gli enrichment AI standard (ChatGPT, Claude, Gemini) processano dati gi�e0 presenti nella tua collezione usando la conoscenza esistente dell'AI. L'AI Agent pu�f2 interagire attivamente con il web live eseguendo ricerche Google, navigando siti e estraendo nuove informazioni in base al tuo prompt.

Quanto sono accurati i risultati?

L'accuratezza dipende molto dalla chiarezza e specificit�e0 del tuo prompt, dalla complessit�e0 del task e dalle informazioni disponibili online. Fornire istruzioni chiare, esempi e regole per la gestione degli errori migliora i risultati. Datablist spesso fornisce un punteggio di confidenza per gli output dell'AI Agent per valutarne l'affidabilit�e0.