Scrapes agency listings from Clutch.co including company names, ratings, services, pricing, and profile links

## Goal
Visit the Clutch.co URL I am going to give you and extract the agency information.

## Information I want you to extract:

- Company Name
- Clutch Profile URL (full absolute URL to the company profile page, e.g. https://clutch.co/profile/company-name)
- Tagline / Summary (the short description shown below the company name)
- Min. Project Size (e.g. $10,000+, $25,000+)
- Avg. Hourly Rate (e.g. $25 - $49 / hr)
- Employee Count (e.g. 10 - 49, 50 - 249, 250 - 999)
- Location (city and country as displayed, e.g. Denpasar, Indonesia)
- Rating (overall star rating out of 5.0)
- Number of Reviews (total number of reviews shown)
- Primary Service (the service with the highest percentage, e.g. "40% UX/UI Design")
- All Services (comma-separated list of all services provided, e.g. "UX/UI Design, Custom Software Development, Mobile App Development")
- Verified Status (Premier Verified, Verified, or Not Verified)

## How to handle pagination:
- The pagination on Clutch.co is done using the "?page=X" URL parameter
- Example: https://clutch.co/id/agencies/ui-ux?page=2, https://clutch.co/id/agencies/ui-ux?page=3
- Use this parameter to navigate through all pages of results

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- For ratings, return the numeric value (e.g. "4.8") not the star icons
- If a company has no reviews yet, return "0" for Number of Reviews and "N/A" for Rating
- For the Primary Service, always include the percentage (e.g. "40% UX/UI Design")
- For All Services, list them without percentages, separated by commas

## Additional Instructions:
- Extract information from the listing cards on the search results page
- Do not navigate into individual company profiles, extract only what is visible on the listing page
- Skip sponsored/featured banners that are not actual company listings
- Some listings may show a "Serves [Location]" instead of a physical location, extract that as the Location value
- Important: Do not extract anything else but the requested information

Come usare questo AI Prompt

  1. Crea una nuova collezione: Inizia creando una nuova collezione vuota in Datablist dove verranno salvati i dati. Clicca su '+ Create new collection' nella sidebar.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Seleziona la fonte AI Agent: Clicca su "See all sources" oppure vai su "Import" -> "Import From Data Sources". Scegli "AI Agent - Site Scraper".
Seleziona AI Agent - Site Scraper
Seleziona AI Agent - Site Scraper
  1. Configura la fonte:

    • Select Template: Trova e scegli il prompt dal menu a tendina "Template". Il prompt qui sopra verr�e0 caricato automaticamente.
    • URL to Scrape: Inserisci l'URL da cui fare scraping
    • Enable Pagination (Opzionale): Se i risultati sono su pi�f9 pagine, seleziona Enable Pagination e imposta un Max Pages ragionevole (es. 10).
    • Customize (Opzionale): Puoi scegliere il modello AI (es. GPT-4o mini spesso �e8 conveniente), modificare il prompt per esigenze specifiche o cambiare gli Outputs previsti.
AI web scraping > Web scraping tradizionale
AI web scraping > Web scraping tradizionale
  1. Rivedi gli Outputs: Clicca su Continue. Datablist mostrer�e0 i campi di output definiti nel prompt (Project Name, Client Company Name). Clicca sull'icona + accanto a ciascuno per creare le relative propriet�e0 (colonne) nella tua collezione.
Outputs
Outputs
  1. Esegui l'import: Clicca su Run import now. L'AI Agent inizier�e0 a fare scraping del sito in base al prompt e popoler�e0 la tua collezione.

Prezzi

Questa fonte dati utilizza i Datablist credits in base all'uso. I costi dipendono dalla complessit�e0 del sito e dal numero di pagine visitate.

Consiglio: esegui prima l'AI Agent su una singola pagina per stimare il costo.

FAQ

Come avviare un'altra esecuzione con la stessa configurazione?

Dopo aver eseguito il tuo AI Agent, clicca sul pulsante rosa in alto a destra della tua tabella dati per riaprirlo con le ultime impostazioni usate.

Usa le impostazioni esistenti del tuo agent
Usa le impostazioni esistenti del tuo agent

Cosa succede se l'AI Agent prova ad accedere a un sito protetto o viene bloccato?

L'AI Agent usa automaticamente server proxy quando necessario per accedere a siti che potrebbero avere protezioni anti-scraping o restrizioni geografiche. Questo aumenta le possibilit�e0 di estrazione dati con successo, anche se siti molto protetti possono comunque essere difficili.

Quanti dati posso processare con l'AI Agent?

Quando esegui l'AI Agent (come enrichment o come fonte dati), le collezioni Datablist possono gestire fino a 100.000 elementi (righe). Per dataset pi�f9 grandi, potresti dover dividere i dati in pi�f9 collezioni.

In cosa l'AI Agent �e8 diverso dagli enrichment ChatGPT/Claude/Gemini?

Gli enrichment AI standard (ChatGPT, Claude, Gemini) processano dati gi�e0 presenti nella tua collezione usando la conoscenza esistente dell'AI. L'AI Agent pu�f2 interagire attivamente con il web live eseguendo ricerche Google, navigando siti e estraendo nuove informazioni in base al tuo prompt.

Quanto sono accurati i risultati?

L'accuratezza dipende molto dalla chiarezza e specificit�e0 del tuo prompt, dalla complessit�e0 del task e dalle informazioni disponibili online. Fornire istruzioni chiare, esempi e regole per la gestione degli errori migliora i risultati. Datablist spesso fornisce un punteggio di confidenza per gli output dell'AI Agent per valutarne l'affidabilit�e0.