Scrapes detailed company and founder information from YC startup profile pages.

## Goal
- I want to visit and extract company and founder information from the given Y Combinator startup profile page

## Information to extract

**Company Information:**
- Startup Description
- Market / Industry (Broad industry they operate in e.g., SAAS, Fintech, Consumer, B2B, Industrials)
- Niche (The niche they focus on e.g., No-Code, Accounting, Sales, Supply Chain)
- Founding Year
- Batch
- Team Size
- Status (Active, Public, Acquired, etc.)
- Location
- Primary Partner
- Website URL
- LinkedIn Company Page
- X (Twitter) Company Page

**Founder Information (up to 3 founders):**
- Founder 1 Name
- Founder 1 LinkedIn URL
- Founder 1 X URL
- Founder 2 Name
- Founder 2 LinkedIn URL
- Founder 2 X URL
- Founder 3 Name
- Founder 3 LinkedIn URL
- Founder 3 X URL


## Instructions
- In the case you don't find information, keep the field empty.
- Important: Do not extract anything else but the requested information.
- For founder information, extract up to 3 founders. If there are fewer than 3 founders, leave the remaining fields empty.
- Make sure to extract the full URLs for LinkedIn and X profiles.

## Input
- The Y Combinator URL to visit: /YCCompanyURL

Jak używać tego AI promptu

  1. Utwórz nową kolekcję: Zacznij od utworzenia nowej, pustej kolekcji w Datablist, w której zostaną zapisane dane. Kliknij „+ Create new collection” w panelu bocznym.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Wybierz źródło AI Agent: Kliknij „See all sources” lub przejdź do „Import” -> „Import From Data Sources”. Wybierz „AI Agent - Site Scraper”.
Wybierz AI Agent - Site Scraper
Wybierz AI Agent - Site Scraper
  1. Skonfiguruj źródło:

    • Select Template: Znajdź i wybierz prompt z listy „Template”. Powyższy prompt zostanie załadowany automatycznie.
    • URL to Scrape: Wprowadź URL do scrapingu
    • Enable Pagination (Optional): Jeśli wyniki są na kilku stronach, zaznacz Enable Pagination i ustaw rozsądny limit Max Pages (np. 10).
    • Customize (Optional): Możesz dopasować model AI (np. GPT-4o mini bywa korzystny kosztowo), edytować prompt pod konkretne potrzeby lub zmienić oczekiwane Outputs.
AI web scraping > Zwykły web scraping
AI web scraping > Zwykły web scraping
  1. Review Outputs: Kliknij Continue. Datablist pokaże pola wyjściowe zdefiniowane w prompt (Project Name, Client Company Name). Kliknij ikonę + obok każdego, aby utworzyć odpowiednie właściwości (kolumny) w Twojej kolekcji.
Outputs
Outputs
  1. Run Import: Kliknij Run import now. AI Agent rozpocznie scraping strony zgodnie z promptem i zapełni Twoją kolekcję.

Cennik

To źródło danych korzysta z kredytów Datablist w modelu rozliczeń za użycie. Koszt zależy od złożoności strony i liczby odwiedzonych stron.

Przetestuj uruchomienie AI Agent najpierw na pojedynczej stronie, aby oszacować koszt.

FAQ

Jak uruchomić kolejne zadanie z tą samą konfiguracją?

Po uruchomieniu AI Agent kliknij różowy przycisk w prawym górnym rogu tabeli danych, aby otworzyć go ponownie z ostatnimi ustawieniami.

Użyj istniejących ustawień agenta
Użyj istniejących ustawień agenta

Co się stanie, jeśli AI Agent spróbuje uzyskać dostęp do chronionej strony lub zostanie zablokowany?

AI Agent automatycznie używa serwerów proxy, gdy to konieczne, aby dotrzeć do stron z zabezpieczeniami przed scrapingiem lub ograniczeniami geograficznymi. Zwiększa to szanse na skuteczną ekstrakcję danych, choć bardzo silnie chronione witryny nadal mogą stanowić wyzwanie.

Ile danych mogę przetworzyć za pomocą AI Agent?

Podczas uruchamiania AI Agent (zarówno jako wzbogacenie, jak i źródło danych) kolekcje Datablist mogą przetwarzać do 100 000 elementów (wierszy). W przypadku większych zbiorów danych możesz potrzebować podzielić je na kilka kolekcji.

Czym AI Agent różni się od wzbogaceń ChatGPT/Claude/Gemini?

Standardowe wzbogacenia AI (ChatGPT, Claude, Gemini) przetwarzają dane już znajdujące się w Twojej kolekcji, korzystając z istniejącej wiedzy AI. AI Agent potrafi aktywnie działać w sieci — wykonywać wyszukiwania w Google, przeglądać strony i pozyskiwać nowe informacje na podstawie Twojego promptu.

Jak dokładne są wyniki?

Dokładność w dużej mierze zależy od klarowności i precyzji Twojego promptu oraz złożoności zadania i dostępności informacji online. Dostarczenie jasnych instrukcji, przykładów i zasad obsługi błędów poprawia wyniki. Datablist często podaje ocenę pewności (confidence score) dla wyników AI Agent, aby pomóc ocenić wiarygodność.