招聘网站抓取工具确实很有用,但大多数都有一个明显的问题:只能抓取单一招聘网站。 放在 2010 年,Monster 还占据主导地位的时候,这种方式也许还能用;但现在职位信息早已分散到几十个平台上,只抓一个网站,往往既费时间也费预算。

所以,如果你想更全面地掌握招聘市场上的职位机会, 就需要把多个来源的职位信息聚合起来。这正是多招聘网站抓取的价值所在:它可以让你一次性采集 19 个招聘网站的数据。

📌 给赶时间的你先看结论

大多数职位抓取工具一次只能抓一个招聘网站,这意味着你得反复运行多个 scraper。如今职位信息已经分散在大量招聘平台上,只抓一个网站,数据一定是不完整的,也会错过那些正急着招聘、需求最明确的公司。

这篇指南会介绍 Datablist 可抓取的 19 个招聘网站(包括 Indeed、Glassdoor、LinkedIn 以及各地区平台)、两种抓取职位的方法(基于筛选条件和基于公司名单),并一步步演示具体操作,以及如何把这些职位数据真正用到销售和营销触达中。

📺 更喜欢看视频?

如果你和我一样,更喜欢看而不是读,可以直接看这个视频:如何同时抓取 19 个招聘网站的职位信息 👈🏽

本文内容一览

我如何同时抓取 19 个招聘网站:方法说明

如果你想同时抓取 19 个招聘网站,通常有两种做法:

  • 自己为每个招聘网站单独开发 scraper,并处理复杂代码
  • 使用 Datablist 的职位抓取工具,它已经聚合了全球 19 个招聘网站

你应该也猜到了,我用的是 Datablist 的 scraper,一次性提取 19 个平台上的所有职位信息。

Datablist Job Postings Scraper
Datablist Job Postings Scraper

💡 什么是 Datablist

Datablist 是一个用来搭建 lead generation workflows 的平台,帮助你通过超过 60 种工具查找、Enrich 和清洗数据。这些工具覆盖 AI AgentsEmail FindersAI processorsTechnology enrichments 等等。

除此之外,Datablist 还支持你建立按计划自动运行或按需触发的自动化 workflows。 下面是一些用户非常常见的使用场景:

  1. 构建 lead list
  2. 用 AI 个性化邮件
  3. 清洗并去重 CRM 数据
  4. 一次抓取 19 个招聘网站的职位
  5. 安全抓取 LinkedIn Sales Navigator 搜索结果,降低账号风险

说得更直接一点:如果你的工作需要获取数据、清洗数据,或者把和数据相关的 workflows 自动化,而且你希望它简单、快速、稳定,那 Datablist 会是一个非常合适的选择。

Datablist 可抓取的招聘网站列表

和市面上其他职位数据抓取工具相比,Datablist 有一个很突出的优势:它可以一次聚合 19 个招聘网站的数据, 省掉你分别搭建和维护多个 scraper 的大量时间。

以下是它支持抓取的招聘网站:

全球招聘网站:

  • Indeed:全球覆盖最广的招聘平台之一,横跨多数国家和行业。
  • Glassdoor:全球知名平台,不仅有职位信息,也有大量公司评价内容。

区域型招聘网站:

  • 亚洲与大洋洲
    • Seek:澳大利亚和新西兰市场的领先平台
    • Naukri:印度市场头部招聘网站,职位数量非常大
    • Naukri Gulf:专注中东地区招聘市场
    • JobsDB:在东南亚多个国家有很强影响力
    • Jobstreet:在马来西亚、菲律宾、新加坡等亚洲市场非常常见
  • 欧洲
    • Infojobs:西班牙市场占主导,也覆盖部分拉美地区
    • Tecnoempleo:聚焦西班牙,尤其适合技术岗位
    • Welcome to The Jungle:法国市场的大型平台,也在向其他欧洲市场扩展

垂直招聘网站与 ATS 系统:

  • Startup Ecosystem
    • AngelList(现为 Wellfound):主要覆盖美国科技创业公司职位
    • Startup Jobs:专注北美早期创业公司岗位
  • ATS Systems(Applicant Tracking Systems)
    • Workable、Greenhouse、Lever、Ashby、Join、BambooHR、SimplyHired:Datablist 也会抓取这些系统中的职位数据,进一步扩大你的市场覆盖范围
Job Boards and their strengths
Job Boards and their strengths

如何一次抓取多个招聘网站职位:分步教程

在 Datablist,我们一直认为,用户应该尽可能掌控自己获取什么数据,以及如何获取这些数据。

所以,我们提供了 2 种抓取职位信息的方式:

  1. 使用 Datablist 的搜索筛选条件
  2. 基于公司名单搜索职位信息

使用筛选条件抓取多个招聘网站职位

这一部分,我会演示如何在 Datablist 的招聘网站聚合器中,使用关键词、seniority、地区等条件来筛选职位。

开始吧。

首先,注册 Datablist

Datablist.com landing page
Datablist.com landing page

创建一个 Collection

Datablist home page
Datablist home page

点击 Job Postings Search

Datablist’s Job Boards Scraper
Datablist’s Job Boards Scraper

接下来,使用 Datablist 提供的 14 个筛选条件进行配置(下面会详细介绍这些 filters)。

Filter configuration for Datablist’s Job Boards Scraper
Filter configuration for Datablist’s Job Boards Scraper

职位与公司筛选条件

下面是 Datablist 职位聚合器中可用的筛选项。

职位筛选:

  • Job Title Keywords: 输入以逗号分隔的关键词(例如 “developer, marketing”),不区分大小写。
  • Exclude Job Titles: 包含这些关键词的职位会被排除(例如 “intern”)。
  • Description Keywords: 输入以逗号分隔的描述关键词(例如 “python, crm”),不区分大小写。
  • Job Seniority: 按职位经验级别筛选。
  • Remote Status: 按远程办公状态筛选。
  • Locations: 输入以逗号分隔的城市或地区(例如 “paris, london”)。
  • Countries: 按国家筛选职位。

公司筛选:

  • Filter Job Postings by a Selected List of Companies: 这一点会在“按 CRM 公司抓取职位”部分详细说明。
  • Exclude Job Postings from a Selected List of Companies: 适合在 lead generation workflow 中排除现有客户;也可以用于避免在新搜索中重复抓取同一批公司
  • Company Type: 可选 Direct Employer and Recruiting Agency(默认)、Direct Employer only 或 Recruiting Agency only。
  • Company Industries: 可包含或排除指定行业;当你选择或排除某个行业时,其子行业也会自动包含在内。查看完整行业列表及说明
  • Company Funding Stage: 按创业公司融资阶段筛选。

其他筛选与设置:

  • Hiring Manager Info: 仅显示包含招聘负责人信息(姓名、LinkedIn、Title)的职位。
  • LinkedIn URL: 仅显示公司拥有 LinkedIn 主页的职位。
  • Job Posting Age: 可选择最近 24 小时、3 天、7 天、15 天、1 个月(默认)、2 个月或 6 个月。
  • Results Limit: 返回职位数量上限(填 0 时默认返回 1000 条)。

💡 3 个实用的筛选建议

建议 1: 你只为结果付费。所以最好在抓取前就设置好 filters,而不是抓完后再清洗。这样从一开始数据就更干净。

建议 2: 使用 “Hiring Manager Info” filter,可以直接拿到带 LinkedIn 资料的职位。这通常是找到可联系对象最快的方法。

建议 3: 如果你没有启用 “Hiring Manager Info” filter,也没关系——后续可以用 Datablist 的 “Waterfall People Search” 来补充寻找联系人。

排除之前已抓取的公司,避免新搜索重复

你可以通过 “Exclude Job Postings posted by a specific list of Companies” 这个 filter,排除那些你之前已经抓取过的公司,从而避免同一家公司重复出现在新的职位搜索结果中。

在你抓取完一轮职位数据后,只需要把 Exclude Job Postings posted by a specific list of Companies 这个筛选项,关联到你已有数据中的 company website 字段,后续搜索时就能自动排除这些公司。

具体步骤如下:

  1. 勾选 “Exclude job offers posted by a specific list of companies”
  2. 选择一个 Collection,其中包含你不想继续抓取职位的公司
  3. 映射 Datablist Collection Property 到保存公司域名的那一列
Excluding companies of job postings search
Excluding companies of job postings search

开始抓取职位信息

当你设置好所有 filters 后,点击 Continue

Search filter in our jobs aggregator
Search filter in our jobs aggregator

Datablist 会返回以下这些数据字段:

分类字段
职位详情Job Title、Job Description、Job Type、Location、Country、Remote Status、Seniority、Salary Range
FirmographicsCompany Name、Company Website、LinkedIn URL、Employee Count、Company Employee Range、Industry、Founded Year、Revenue
附加信息Company Description、City、Country、Job Offers Count、Recent Job Offers Count
职位元数据Job Offer ID、Job URL、Job Source URL、Date Posted
招聘负责人信息Hiring Manager Name、Hiring Manager Job Title、Hiring Manager LinkedIn Profile

滚动到页面底部,点击 Run import now

Output field configuration of Datablist’s Job Boards Scraper
Output field configuration of Datablist’s Job Boards Scraper

当 scraper 跑完后,你看到的结果会像这样:

Results I got from Datablist’s Job Boards Scraper
Results I got from Datablist’s Job Boards Scraper

如何按公司名单抓取职位:分步教程

正如前面提到的,这种方式允许你针对已经存在于 Datablist workspace、CRM 或其他数据库中的公司,抓取它们当前发布的职位信息。

要实现这一点,你需要先在 Datablist 的某个 collection 中准备好 公司名称、公司 LinkedIn URL,或者网站 URL

首先,注册 Datablist

Datablist.com landing page
Datablist.com landing page

Import 一份公司名单。

Datablist’s home page
Datablist’s home page

创建一个单独的 Collection

Creating a new collection in Datablist
Creating a new collection in Datablist

打开 Job Offers Search

Datablist’s Job Board Scraper
Datablist’s Job Board Scraper

然后按下面的步骤操作:

  1. 勾选 “Filter by companies”
  2. 选择 你刚刚上传的 collection
  3. 映射 Datablist Collection Property 到包含公司域名的那一列
  4. 使用我们的 filters 定义你要抓取的职位范围。点击这里查看全部筛选条件
Scraping job postings only for specific companies
Scraping job postings only for specific companies

你也可以用同样的逻辑,指定一个 collection,把其中的公司网站或域名作为排除名单,不让这些公司出现在职位抓取结果中。

💡 3 个职位抓取实用建议

建议 1: 在职位搜索中排除当前活跃客户,避免出现尴尬的触达场景。

建议 2: 把老客户纳入职位搜索范围,有助于重新激活他们。

建议 3: 你不仅可以用域名筛选或排除公司,也可以直接使用网站 URL 和公司名称。

全部设置完成后,点击 Continue

Configured search filters
Configured search filters

接着,滚动到页面底部,点击 Run import now

Output field configuration of Datablist’s Job Boards Scraper
Output field configuration of Datablist’s Job Boards Scraper

就是这么简单。大约 2 到 5 分钟后,Datablist 就会把从 19 个招聘网站抓取到的职位结果返回给你。

Results I got from Datablist’s Job Boards Scraper
Results I got from Datablist’s Job Boards Scraper

📘 使用 Datablist 抓取职位的价格

Datablist 采用 credit 计费模式。抓取 1 条职位信息会消耗 10 Credits。

举个简单的计算例子:

如果你订阅 Datablist 的 starter plan($25/月),再额外充值 $20 获得 20,000 credits,那么你总共会有 25,000 credits。

这意味着你可以抓取 2,500 条职位信息,对于大多数销售、招聘或市场团队来说,这已经是一批相当可观的数据量。

为什么要抓取多个招聘网站,而不是只抓一个?

你听过有人抱怨“我手上的数据太多了”吗?我没听过。因为数据本身就是价值。 大家真正会认同的一点是:并不是所有数据都同样有用,有些有价值,有些则几乎没有意义。

为什么数据来源越多越重要

抓取更多招聘网站, 就意味着你能拿到更多职位信息,也就更有机会从中找到真正有价值的数据。这种更广覆盖的方式,可以确保你不会错过分散在不同平台上的高价值机会。

Benefit of scraping multiple job boards
Benefit of scraping multiple job boards

多招聘网站抓取的核心优势

  • 更大的数据量
    • 不再只依赖一个来源,而是一次覆盖 15+ 数据源
    • 更容易发现目标公司相关的招聘机会
  • 更强的商业洞察
    • 识别哪些公司有即时需求(招聘行为本身就是强信号)
    • 根据企业当前优先事项来筛选 target accounts
    • 在 cold email campaign 中,把招聘信号作为 qualification 变量使用
  • 更明显的竞争优势
    • 如果你是招聘方或猎头,可以更高效地拿下机会
    • 如果你服务求职者,也能提供更完整的职位视图
    • 更早识别招聘趋势,先于竞争对手行动
    • 相比单一平台搜索,获得更全面的市场覆盖
    • 在公司扩张和投入增长阶段,更早建立联系

既然你已经知道这些数据为什么有价值,接下来我们看看,拿到这些职位数据之后还能做什么。

职位数据还能怎么用?

没错,Datablist 在招聘网站抓取这件事上确实很强, 但这甚至还不到它能力的 1%。下面给你几个拿到职位数据后可以继续做的方向:

  1. 用更多信息来 Enrich 公司数据
  2. 使用 AI Agent 搜索数据库中没有的信息
  3. 在目标客户公司中找到决策人
  4. Waterfall Enrichment 查找邮箱和电话号码
  5. 用 AI 编写个性化邮件
  6. 分析公司的技术栈

这个清单还可以继续列很长。重点是:Datablist 不只是一个抓取工具,它让你通过一个价格友好的订阅,就能进入完整的 lead generation 生态。

结论

抓取多个招聘网站,本质上是一种非常现实的竞争优势。只要还有机会,你就应该尽早利用起来。Datablist 让获取职位数据这件事变得比多数工具都更简单,而且你甚至可以直接针对 CRM 中已有的公司去搜索它们当前的职位发布情况。

FAQ

抓取职位信息合法吗?

招聘网站抓取在法律上通常处于灰色地带。一般来说,采集公开数据未必违法,但很多招聘网站会在自己的 Terms of Service 中明确禁止抓取。是否合法,取决于你的抓取方式(例如是否尊重 robots.txt)、采集了什么数据,以及你如何使用这些数据。

抓取职位信息是什么意思?

抓取职位信息,是指使用自动化工具从不同网站提取职位列表数据。通常会采集 Job Title、职位描述、公司信息、地点、薪资范围等内容。

最好的职位抓取工具是什么?

Datablist 是一个非常强的职位抓取工具,因为它可以同时聚合 19 个不同招聘网站的职位信息。它支持针对职位详情、公司信息和招聘负责人数据进行精细筛选。除了抓取之外,Datablist 还提供数据 Enrichment、AI 搜索和自动化能力。

ChatGPT 可以直接找职位列表吗?

ChatGPT 不能直接实时从网络上抓取职位列表。它可以提供通用的求职建议,但像 Datablist 这样的专业工具,才是专门为跨平台抓取职位信息而设计的,并且能返回更完整的数据,包括公司信息、薪资信息以及招聘负责人联系方式。

抓取到的职位数据怎么用于 outreach campaign?

职位数据能为定向 outreach campaign 提供非常有价值的商业信号。你可以识别出正在积极招聘的公司(这通常意味着业务增长)、找到决策人、补充联系信息,并结合 AI 根据对方的具体招聘需求生成更个性化的消息。相比泛泛而谈的触达方式,这种做法通常会显著提升回复率。

从招聘网站抓取能拿到哪些数据字段?

像 Datablist 这样的招聘抓取工具,可以提取相当完整的数据,包括职位详情(标题、描述、类型、地点、薪资)、公司信息(名称、官网、LinkedIn、规模、行业)、招聘负责人信息(姓名、Title、LinkedIn),以及发布时间等元数据。这类高密度数据对销售、市场和招聘分析都很有价值。

应该抓取多少个招聘网站?

和只依赖单一来源相比,同时抓取多个招聘网站的效果通常会好得多。像 Datablist 这样的工具可以一次抓取 19 个招聘网站,让你获得更完整的市场覆盖、更多潜在客户机会,也能更早看见招聘趋势,从而先于竞争对手行动。