很多工具都号称可以“no-code”抓取 Y Combinator 的创业公司目录。但实际用起来,你很容易被 API、复杂的 point-and-click 界面、CSS selector 这些东西困住。说是无代码,本质上只是把技术细节包了一层不太好用的 UI。

问题在于: 它们都在卖“简单”,最后却变成了一堂编程课。

这篇指南不一样: 我会展示一种真正 no-code 的方法,从 Y Combinator 目录里抓取 startup 数据。我们说 no-code,就是字面意思。

用 Datablist 抓取 YC startup directory 时,我们甚至可以直接承诺:

↳ 你不需要配置 API,也不需要检查网页元素

↳ ↳ 你只需要用自然语言告诉 AI 你想要什么,也就是 prompting。

↳ ↳ ↳ 就连这一步,我们也已经准备好了可直接使用的模板

📌 给赶时间的人看的摘要

这篇文章会教你如何在没有技术负担的情况下,从 Y Combinator directory 抓取 startup 数据。如果你时间有限,先看这个摘要:

问题: 大多数 web scraping 工具都声称自己是“no-code”,但仍然要求你处理 API 或理解网页元素。本质上只是换了一种形式制造技术麻烦。

为什么这是问题: 如果你想要一个真正简单的方案来抓取 YC startups,就不应该需要技术背景,也不应该花几个小时看教程。

解决方案: 使用 Datablist 的 AI Agent 和现成的 YC directory scraper 模板。你只需要粘贴 URL,然后点击开始。

你会学到什么: 本指南会介绍抓取 YC directory 的 2 个阶段,解释为什么 Datablist 是更合适的选择,并回答关于 no-code 抓取 YC companies 的常见问题。

为什么用 Datablist: 3 个简单理由

  1. 真正 no-code,直接使用模板,无需 set-up
  2. 价格友好,套餐从 $25/month 起,还支持灵活购买额外 credits
  3. 一个平台里可以使用 60+ lead generation tools

这篇指南会讲什么

Datablist 是什么?

Datablist 是一个用于自动化 lead generation 工作流的平台。你可以用它通过 60 多种工具查找、清洗和 enrich 数据,包括 AI AgentsEmail FindersAI processorsTechnology enrichments 等。

此外,Datablist 还可以帮你搭建按计划或按需运行的自动化工作流。下面是一些 Datablist 用户常用的实际场景:

  1. 构建 lead lists

  2. 用 AI 个性化 emails

  3. 清洗 CRM 并去重

  4. 一次性从 19 个 job boards 抓取职位信息

  5. 在不影响账号安全的情况下抓取 LinkedIn Sales Navigator 搜索结果

我的意思很简单:如果你的工作涉及数据获取、数据清洗,或数据相关流程自动化,并且你希望它简单、快速、可靠,Datablist 就是合适的工具。

💡 用 35 个词概括 Datablist

Datablist 是一个用于自动化 lead generation 工作流的平台,提供 60+ 工具,包括 AI Agents、用于查找邮箱和电话的 Waterfall Enrichment、去重等数据清洗工具。

抓取 YC Startup Directory 的两步流程

前面我说 Datablist 很容易上手,不是随便说说。整个流程非常简单,每个阶段只需要点击几次。不过在开始之前,我先给你看一个关键点。

如何找到最相关的 YC Startups

Y Combinator directory 里有数千家 startups,分布在不同 batch、行业和细分市场。下面是更高效筛选目标 startup 的方法:

  1. 打开 ycombinator.com/companies

  2. 使用左侧边栏的筛选项:

    Batch: 选择特定 YC batch(例如 Winter 2025),用于定位最新的 startups 或更成熟的公司

    Industry: 选择 B2B、Consumer、Healthcare、Fintech 等大类

    Region: 如果你关注特定市场,可以按地理位置筛选

    Company Size: 选择团队规模区间,让列表更接近你的 ideal customer profile

  3. 使用搜索框按关键词查找 startups。需要精确匹配时,用引号,例如 “AI”

  4. 组合多个筛选条件,进一步缩小结果范围

  5. 设置好筛选条件后,复制浏览器里的 URL

YC startup directory
YC startup directory

Pro tip: 筛选越具体,结果越精准。比如你卖 dev tools,可以筛选 B2B + recent batches + 2-10 team size,找到正处在增长期、也更可能有采购需求的 startups。

💡 为什么筛选很重要

YC directory 里有 5,000 多家公司。

但关键在这里:每个列表最多只展示 1,000 家 startups。如果你不加筛选直接抓取,会漏掉大部分数据。

这就是为什么筛选很重要。一个符合你 ICP 的 100 家 startup 精准列表,永远比 1,000 家随机公司更有价值。

阶段 1:从 YC Directory 抓取 Startup 列表

第一阶段是从 YC directory 的搜索结果中提取基础信息。这会给你一个后续可继续处理的公司基础列表。

阶段 1 - 步骤 1:注册并创建 Collection

首先,注册 Datablist.com

Beautiful home page
Beautiful home page

然后,创建一个 New Collection

Start page
Start page

阶段 1 - 步骤 2:创建第一个 Property,避免重复数据

Y Combinator directory 里有些 startups 可能会在搜索结果中出现不止一次。如果你不想在 collection 里看到同一家公司出现多次,可以这样做:

  1. 创建一个 New Property,命名为 "YC Company URL"
Creating a property
Creating a property
  1. 点击 Column Header,选择 Rename - Settings - Delete
Property settings
Property settings
  1. 勾选 "Do not allow duplicate values" 旁边的复选框,然后点击 Save Property
Preventing duplicates
Preventing duplicates

阶段 1 - 步骤 3:进入 AI Scraping Agent

  1. 点击应用顶部菜单里的 Import,然后选择 Import From Data Sources
Importing data
Importing data
  1. 向下滚动,选择 AI Agent - Site Scraper
Sources
Sources

现在,你会看到一个新的界面,大概是这样:

AI Agent
AI Agent

阶段 1 - 步骤 4:选择模板

  1. 点击 Template Drop-Down,选择 "YC Startup Directory Scraper"
So many templates
So many templates
  1. 在第一个字段里粘贴你的 YC directory URL
URL field
URL field
  1. 向下滚动,点击 Continue
Settings
Settings

阶段 1 - 步骤 5:选择输入并开始 Scrape

因为名称相同,Datablist 会自动映射第一个 property。

对于其他 properties,点击 ⊕ Icon 将它们添加到你的 collection 中。

完成后,点击 Run Import Now 开始 scraping。

Last step
Last step

几分钟后,你的结果会像这样:

So many startups
So many startups

现在你应该已经有了:

  • Startup Name
  • YC Company URL
  • ……以及很多其他字段

你可以到这里就停下,也可以继续进入阶段 2,获取 founders 的信息。

阶段 2:抓取公司与创始人详情

在这个阶段,我们会访问每家 startup 的 Y Combinator profile page,并提取更详细的公司和 founder 信息,包括:

Company Information:

  1. Startup Name
  2. Startup Description
  3. Founded Date
  4. Batch
  5. Team Size
  6. Status(Active、Public、Acquired)
  7. Location
  8. Primary Partner
  9. Website URL
  10. LinkedIn Company Page URL
  11. X (Twitter) Company Page URL

Founder Information(每家公司最多 3 位 founders):

  1. Founder Names
  2. Founder LinkedIn URLs
  3. Founder X (Twitter) Accounts

这里还有一篇指南,讲的是如何通过 LinkedIn URL 查找邮箱 👈🏽

阶段 2 - 步骤 1:创建新的 Collection

创建一个 New Collection

Pro tip: 使用快捷键 N 可以快速创建 new collections

Creating new collection
Creating new collection

阶段 2 - 步骤 2:选择模板

  1. 选择 AI Agent - Run on Collection Items
Empty collection
Empty collection

现在,你会看到这个界面:

AI Agent
AI Agent
  1. 点击 Template Drop-Down,选择 "YC Company & Founder Details Scraper"。
Selecting a template
Selecting a template

阶段 2 - 步骤 3:映射 Collection 和 Input Property

  1. 点击第二个下拉菜单,选择你在阶段 1 刚刚创建的 collection
Selecting a collection
Selecting a collection
  1. 现在,向下滚动到 prompt 末尾,把 YC company URL 插入为 Input Property

    你可以输入 /,然后选择 YC Company URL

Mapping URL
Mapping URL
  1. 完成上面的步骤后,向下滚动并点击 Continue
Settings
Settings

阶段 2 - 步骤 4:选择 Outputs

Datablist 会自动创建所有 properties。

如果有些数据点你不需要,点击 ✕ Icons 将它们从 collection 中移除。

完成后,向下滚动并点击 Run Import Now 开始 scraping。

Last step
Last step

几分钟后,你的结果会像这样:

Results
Results

现在你已经拿到了完整数据: 公司详情、社交资料和 founder 信息,都集中在一个地方。

为什么 Datablist 是抓取 YC Directory 的最佳选择

当你比较不同的 Y Combinator startup scraping 方案时,会很快发现:并不是所有“no-code”工具都一样。Datablist 从一开始就是为了消除其他平台仍然存在的技术摩擦而设计的。 证据很直接:

价格优势

  • 起价仅 $25/month; 在市场上属于入门门槛很低、但能力很强的 scraping 方案
  • 灵活的 credit system: 每月免费 credits 用完了?你可以直接购买一次性的 credit package,而不必升级整个套餐。

另外, 使用 Datablist,你不会遇到那些不断“跟进”的强推销售。

Easier than tying shoes
Easier than tying shoes

易用性

用户友好非常重要,这也很可能是 Datablist 做得最好的地方。

使用我们的 AI Agent,你不需要:

  • 阅读文档
  • 理解 API
  • 在令人困惑的网页元素上 point-and-click

只要粘贴 Y Combinator directory URL,scraping 模板就可以立即使用。 没有复杂配置。即使你想修改模板、抓取不同的数据,也可以直接用自然语言完成。告诉 AI 你想要什么,剩下的交给它处理。

Simple but powerful
Simple but powerful

Lead Generation 生态

Scraping data 通常只是第一步。更重要的是你接下来如何使用这些数据。使用 Datablist,你得到的不只是一个 YC scraper,而是一个包含 60+ 工具的完整生态,用来支持你的 lead generation 工作。

拿到 YC startups 和 founders 列表后,你可以马上使用 Datablist 的其他工具,例如:

It’s like a big mall
It’s like a big mall

结论:抓取 YC 本来就应该很简单

从 Y Combinator directory 抓取 startups,不应该变成一个需要你“配置”和“研究”的项目。它应该是一项简单、快速的任务,直接给你业务增长所需的数据。

和那些仍然需要大量配置的“templates”不同,使用 Datablist 的 AI Agent,你唯一需要做的就是选择 YC template,粘贴 URL,然后启动流程。

你会在几分钟内得到一份干净、结构化的 leads 列表,而不是花几个小时折腾设置。这样你就可以把精力放在真正重要的事情上:联系潜在客户并创造收入。

P.S. 用 Datablist,真的比系鞋带还简单。

关于抓取 YC Startup Directory 的常见问题 FAQ

抓取 YC Directory 需要多少钱?

费用取决于你使用的工具。订阅 Datablist 后,每个月都会获得 5,000 个 free credits,所以你最低可以从 $25/month 开始 scraping。AI Agent 和 Datablist 里的其他工具一样,按 credits 计费,也就是 usage-based。例如,要抓取 500 家 YC startups,并获取完整公司和 founder details,大约需要 1000-1500 credits。

如何从 YC Directory 抓取 Startups?

最简单的方法是使用像 Datablist 这样的 no-code 工具。你可以直接使用 YC directory 的预构建 AI Agent templates。只要提供带有目标筛选条件的 directory URL,agent 就会通过简单的两阶段流程,自动提取 startup names、descriptions、founder information、social profiles 等数据。

抓取 YC Directory 合法吗?

抓取公开可访问的数据,例如 Y Combinator directory 里的 startup listings,通常被认为是合法的。不过,你仍然需要尊重网站的 terms of service,并以合规、负责任的方式使用数据,尤其是在 lead generation 场景中。

我可以从 YC Directory 获取哪些数据?

通常,你可以抓取 startup profiles 上展示的所有关键信息,包括:

Startup Info:

  • Startup Name
  • Startup Description
  • Founded Date
  • Batch
  • Team Size
  • Status
  • Location
  • Primary Partner
  • Website URL
  • LinkedIn URL
  • X URL

Founders Info:

  • Founder Names(最多 3 位)
  • Founder LinkedIn URLs
  • Founder X Accounts

为什么要抓取 YC Startups?

YC startups 是高潜力 leads,因为它们通常融资情况更好、增长更快,也正在积极搭建团队和技术栈。无论你销售软件、服务,还是做人才招聘,YC companies 往往都处在更强的采购或合作窗口期。在竞争对手之前拿到它们的联系信息,会带来非常明显的优势。

我可以自定义抓取哪些数据吗?

可以。Datablist 提供 ready-to-use templates,但你也可以用自然语言进行自定义。只要告诉 AI 你还想提取哪些信息,它就会相应调整 scraping process。不需要写代码。