Scrapes agency listings from Clutch.co including company names, ratings, services, pricing, and profile links

## Goal
Visit the Clutch.co URL I am going to give you and extract the agency information.

## Information I want you to extract:

- Company Name
- Clutch Profile URL (full absolute URL to the company profile page, e.g. https://clutch.co/profile/company-name)
- Tagline / Summary (the short description shown below the company name)
- Min. Project Size (e.g. $10,000+, $25,000+)
- Avg. Hourly Rate (e.g. $25 - $49 / hr)
- Employee Count (e.g. 10 - 49, 50 - 249, 250 - 999)
- Location (city and country as displayed, e.g. Denpasar, Indonesia)
- Rating (overall star rating out of 5.0)
- Number of Reviews (total number of reviews shown)
- Primary Service (the service with the highest percentage, e.g. "40% UX/UI Design")
- All Services (comma-separated list of all services provided, e.g. "UX/UI Design, Custom Software Development, Mobile App Development")
- Verified Status (Premier Verified, Verified, or Not Verified)

## How to handle pagination:
- The pagination on Clutch.co is done using the "?page=X" URL parameter
- Example: https://clutch.co/id/agencies/ui-ux?page=2, https://clutch.co/id/agencies/ui-ux?page=3
- Use this parameter to navigate through all pages of results

## How to handle data inconsistencies:
- Return only one piece of information for each type
- Return "N/A" if the data isn't available
- For ratings, return the numeric value (e.g. "4.8") not the star icons
- If a company has no reviews yet, return "0" for Number of Reviews and "N/A" for Rating
- For the Primary Service, always include the percentage (e.g. "40% UX/UI Design")
- For All Services, list them without percentages, separated by commas

## Additional Instructions:
- Extract information from the listing cards on the search results page
- Do not navigate into individual company profiles, extract only what is visible on the listing page
- Skip sponsored/featured banners that are not actual company listings
- Some listings may show a "Serves [Location]" instead of a physical location, extract that as the Location value
- Important: Do not extract anything else but the requested information

Så här använder du den här AI-prompten

  1. Create a New Collection: Börja med att skapa en ny, tom collection i Datablist där datan ska lagras. Klicka på '+ Create new collection' i sidomenyn.
AI web scraping > vanlig web scraping
AI web scraping > vanlig web scraping
  1. Select the AI Agent Source: Klicka på "See all sources" eller gå till "Import" -> "Import From Data Sources". Välj "AI Agent - Site Scraper".
Välj AI Agent - Site Scraper
Välj AI Agent - Site Scraper
  1. Konfigurera källan:

    • Select Template: Leta upp och välj prompten i "Template"-rullgardinsmenyn. Prompten ovan laddas automatiskt.
    • URL to Scrape: Ange din URL att skrapa
    • Enable Pagination (Optional): Om resultaten finns på flera sidor, markera Enable Pagination och sätt en rimlig gräns för Max Pages (t.ex. 10).
    • Customize (Optional): Du kan justera AI-modellen (t.ex. GPT-4o mini är ofta kostnadseffektiv), redigera prompten för specifika behov eller ändra förväntade Outputs.
AI web scraping > vanlig web scraping
AI web scraping > vanlig web scraping
  1. Granska Outputs: Klicka på Continue. Datablist visar de output-fält som definieras i prompten (Project Name, Client Company Name). Klicka på +-ikonen bredvid varje fält för att skapa motsvarande egenskaper (kolumner) i din collection.
Outputs
Outputs
  1. Run Import: Klicka på Run import now. AI Agent börjar skrapa webbplatsen baserat på prompten och fyller din collection.

Prissättning

Den här datakällan använder Datablist Credits baserat på användning. Kostnaden beror på webbplatsens komplexitet och antalet besökta sidor.

Testa att köra AI Agent på en enda sida först för att uppskatta kostnaden.

FAQ

Hur startar jag en ny körning med samma konfiguration?

När du har kört din AI Agent klickar du på den rosa knappen längst upp till höger i din datatabell för att öppna den igen med senast använda inställningar.

Använd dina befintliga agentinställningar
Använd dina befintliga agentinställningar

Vad händer om AI Agent försöker komma åt en skyddad webbplats eller blir blockerad?

AI Agent använder automatiskt proxyservrar vid behov för att komma åt webbplatser som kan ha skydd mot scraping eller geografiska begränsningar. Det ökar chansen för lyckad datautvinning, men mycket hårt skyddade sajter kan fortfarande vara en utmaning.

Hur mycket data kan jag bearbeta med AI Agent?

När du kör AI Agent (antingen som berikning eller som en datakälla) kan Datablist-collections hantera upp till 100�a0000 poster (rader). För större dataset kan du behöva dela upp datan i flera collections.

Hur skiljer sig AI Agent från ChatGPT/Claude/Gemini-berikningarna?

Standard-AI-berikningar (ChatGPT, Claude, Gemini) bearbetar data som redan finns i din collection med AI:ns befintliga kunskap. AI Agent kan aktivt interagera med det levande webben—göra Google-sökningar, surfa på webbplatser och extrahera ny information baserat på din prompt.

Hur exakta är resultaten?

Noggrannheten beror i hög grad på hur tydlig och specifik din prompt är, samt på uppgiftens komplexitet och tillgänglig information online. Tydliga instruktioner, exempel och regler för felhantering förbättrar resultaten. Datablist tillhandahåller ofta en konfidenspoäng för AI Agent-utdata för att hjälpa dig bedöma tillförlitligheten.