Scrapes agency listings from Clutch.co including company names, ratings, services, pricing, and profile links

## Goal
Visit the Clutch.co URL I am going to give you and extract the agency information.

## Information I want you to extract:

- Company Name
- Clutch Profile URL (full absolute URL to the company profile page, e.g. https://clutch.co/profile/company-name)
- Tagline / Summary (the short description shown below the company name)
- Min. Project Size (e.g. $10,000+, $25,000+)
- Avg. Hourly Rate (e.g. $25 - $49 / hr)
- Employee Count (e.g. 10 - 49, 50 - 249, 250 - 999)
- Location (city and country as displayed, e.g. Denpasar, Indonesia)
- Rating (overall star rating out of 5.0)
- Number of Reviews (total number of reviews shown)
- Primary Service (the service with the highest percentage, e.g. "40% UX/UI Design")
- All Services (comma-separated list of all services provided, e.g. "UX/UI Design, Custom Software Development, Mobile App Development")
- Verified Status (Premier Verified, Verified, or Not Verified)

## How to handle pagination:
- The pagination on Clutch.co is done using the "?page=X" URL parameter
- Example: https://clutch.co/id/agencies/ui-ux?page=2, https://clutch.co/id/agencies/ui-ux?page=3
- Use this parameter to navigate through all pages of results

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- For ratings, return the numeric value (e.g. "4.8") not the star icons
- If a company has no reviews yet, return "0" for Number of Reviews and "N/A" for Rating
- For the Primary Service, always include the percentage (e.g. "40% UX/UI Design")
- For All Services, list them without percentages, separated by commas

## Additional Instructions:
- Extract information from the listing cards on the search results page
- Do not navigate into individual company profiles, extract only what is visible on the listing page
- Skip sponsored/featured banners that are not actual company listings
- Some listings may show a "Serves [Location]" instead of a physical location, extract that as the Location value
- Important: Do not extract anything else but the requested information

Slik bruker du denne AI-prompten

  1. Create a New Collection: Start med å opprette en ny, tom collection i Datablist der dataene skal lagres. Klikk '+ Create new collection' i sidepanelet.
AI web scraping > Vanlig web scraping
AI web scraping > Vanlig web scraping
  1. Select the AI Agent Source: Klikk "See all sources" eller gå til "Import" -> "Import From Data Sources". Velg "AI Agent - Site Scraper".
Velg AI Agent - Site Scraper
Velg AI Agent - Site Scraper
  1. Konfigurer Source:

    • Select Template: Finn og velg prompten fra "Template"-nedtrekksmenyen. Prompten over lastes inn automatisk.
    • URL to Scrape: Skriv inn URL-en du vil skrape
    • Enable Pagination (valgfritt): Hvis resultatene er på flere sider, huk av for Enable Pagination og sett en fornuftig Max Pages-grense (f.eks. 10).
    • Customize (valgfritt): Du kan justere AI-modellen (f.eks. GPT-4o mini er ofte kostnadseffektiv), redigere prompten for spesifikke behov, eller endre forventede Outputs.
AI web scraping > Vanlig web scraping
AI web scraping > Vanlig web scraping
  1. Review Outputs: Klikk Continue. Datablist viser output-feltene definert i prompten (Project Name, Client Company Name). Klikk +-ikonet ved siden av hvert for å opprette tilsvarende properties (kolonner) i samlingen din.
Outputs
Outputs
  1. Run Import: Klikk Run import now. AI Agent vil starte skraping av nettstedet basert på prompten og fylle samlingen din.

Priser

Denne datakilden bruker Datablist credits basert på forbruk. Kostnadene avhenger av nettstedets kompleksitet og antall sider som besøkes.

Test ved å kjøre AI Agent på én side først for å få et kostnadsestimat.

FAQ

Hvordan starte et nytt kjør med samme konfigurasjon?

Når du har kjørt AI Agent, klikk på den rosa knappen øverst til høyre i datatabellen for å åpne den igjen med dine sist brukte innstillinger.

Bruk dine eksisterende agent-innstillinger
Bruk dine eksisterende agent-innstillinger

Hva skjer hvis AI Agent prøver å få tilgang til et beskyttet nettsted eller blir blokkert?

AI Agent bruker automatisk proxy-servere ved behov for å få tilgang til nettsteder som kan ha scraping-beskyttelser eller geografiske begrensninger. Dette øker sjansen for vellykket datauttrekk, men svært tungt beskyttede nettsteder kan fortsatt være utfordrende.

Hvor mye data kan jeg behandle med AI Agent?

Når du kjører AI Agent (enten som en beriking eller en datakilde), kan Datablist-samlinger håndtere behandling for opptil 100 000 elementer (rader). For større datasett må du kanskje dele dataene i flere samlinger.

Hvordan er AI Agent forskjellig fra ChatGPT/Claude/Gemini-berikelsene?

De standard AI-berikingene (ChatGPT, Claude, Gemini) prosesserer data som allerede ligger i samlingen din ved å bruke AI-ens eksisterende kunnskap. AI Agent kan aktivt samhandle med det levende nettet—utføre Google-søk, bla gjennom nettsteder og hente ny informasjon basert på prompten din.

Hvor nøyaktige er resultatene?

Nøyaktigheten avhenger i stor grad av hvor tydelig og spesifikk prompten din er, samt oppgavens kompleksitet og informasjonen som er tilgjengelig på nettet. Å gi klare instrukser, eksempler og regler for håndtering av feil forbedrer resultatene. Datablist gir ofte en confidence score for AI Agent-outputs for å hjelpe med å vurdere pålitelighet.