招聘网站抓取工具确实很有用,但大多数都有一个明显的问题:只能抓取单一招聘网站。 放在 2010 年,Monster 还占据主导地位的时候,这种方式也许还能用;但现在职位信息早已分散到几十个平台上,只抓一个网站,往往既费时间也费预算。
所以,如果你想更全面地掌握招聘市场上的职位机会, 就需要把多个来源的职位信息聚合起来。这正是多招聘网站抓取的价值所在:它可以让你一次性采集 19 个招聘网站的数据。
📌 给赶时间的你先看结论
大多数职位抓取工具一次只能抓一个招聘网站,这意味着你得反复运行多个 scraper。如今职位信息已经分散在大量招聘平台上,只抓一个网站,数据一定是不完整的,也会错过那些正急着招聘、需求最明确的公司。
这篇指南会介绍 Datablist 可抓取的 19 个招聘网站(包括 Indeed、Glassdoor、LinkedIn 以及各地区平台)、两种抓取职位的方法(基于筛选条件和基于公司名单),并一步步演示具体操作,以及如何把这些职位数据真正用到销售和营销触达中。
📺 更喜欢看视频?
如果你和我一样,更喜欢看而不是读,可以直接看这个视频:如何同时抓取 19 个招聘网站的职位信息 👈🏽
本文内容一览
- 我如何同时抓取 19 个招聘网站:方法说明
- Datablist 可抓取的招聘网站列表
- 如何一次抓取多个招聘网站职位:分步教程
- 如何按公司名单抓取职位:分步教程
- 为什么要抓取多个招聘网站,而不是只抓一个?
- 职位数据还能怎么用?
我如何同时抓取 19 个招聘网站:方法说明
如果你想同时抓取 19 个招聘网站,通常有两种做法:
- 自己为每个招聘网站单独开发 scraper,并处理复杂代码
- 使用 Datablist 的职位抓取工具,它已经聚合了全球 19 个招聘网站
你应该也猜到了,我用的是 Datablist 的 scraper,一次性提取 19 个平台上的所有职位信息。
💡 什么是 Datablist
Datablist 是一个用来搭建 lead generation workflows 的平台,帮助你通过超过 60 种工具 来查找、Enrich 和清洗数据。这些工具覆盖 AI Agents、Email Finders、AI processors、Technology enrichments 等等。
除此之外,Datablist 还支持你建立按计划自动运行或按需触发的自动化 workflows。 下面是一些用户非常常见的使用场景:
说得更直接一点:如果你的工作需要获取数据、清洗数据,或者把和数据相关的 workflows 自动化,而且你希望它简单、快速、稳定,那 Datablist 会是一个非常合适的选择。
Datablist 可抓取的招聘网站列表
和市面上其他职位数据抓取工具相比,Datablist 有一个很突出的优势:它可以一次聚合 19 个招聘网站的数据, 省掉你分别搭建和维护多个 scraper 的大量时间。
以下是它支持抓取的招聘网站:
全球招聘网站:
- Indeed:全球覆盖最广的招聘平台之一,横跨多数国家和行业。
- Glassdoor:全球知名平台,不仅有职位信息,也有大量公司评价内容。
区域型招聘网站:
- 亚洲与大洋洲
- Seek:澳大利亚和新西兰市场的领先平台
- Naukri:印度市场头部招聘网站,职位数量非常大
- Naukri Gulf:专注中东地区招聘市场
- JobsDB:在东南亚多个国家有很强影响力
- Jobstreet:在马来西亚、菲律宾、新加坡等亚洲市场非常常见
- 欧洲
- Infojobs:西班牙市场占主导,也覆盖部分拉美地区
- Tecnoempleo:聚焦西班牙,尤其适合技术岗位
- Welcome to The Jungle:法国市场的大型平台,也在向其他欧洲市场扩展
垂直招聘网站与 ATS 系统:
- Startup Ecosystem
- AngelList(现为 Wellfound):主要覆盖美国科技创业公司职位
- Startup Jobs:专注北美早期创业公司岗位
- ATS Systems(Applicant Tracking Systems)
- Workable、Greenhouse、Lever、Ashby、Join、BambooHR、SimplyHired:Datablist 也会抓取这些系统中的职位数据,进一步扩大你的市场覆盖范围
如何一次抓取多个招聘网站职位:分步教程
在 Datablist,我们一直认为,用户应该尽可能掌控自己获取什么数据,以及如何获取这些数据。
所以,我们提供了 2 种抓取职位信息的方式:
使用筛选条件抓取多个招聘网站职位
这一部分,我会演示如何在 Datablist 的招聘网站聚合器中,使用关键词、seniority、地区等条件来筛选职位。
开始吧。
首先,注册 Datablist。
创建一个 Collection。
点击 Job Postings Search。
接下来,使用 Datablist 提供的 14 个筛选条件进行配置(下面会详细介绍这些 filters)。
职位与公司筛选条件
下面是 Datablist 职位聚合器中可用的筛选项。
职位筛选:
- Job Title Keywords: 输入以逗号分隔的关键词(例如 “developer, marketing”),不区分大小写。
- Exclude Job Titles: 包含这些关键词的职位会被排除(例如 “intern”)。
- Description Keywords: 输入以逗号分隔的描述关键词(例如 “python, crm”),不区分大小写。
- Job Seniority: 按职位经验级别筛选。
- Remote Status: 按远程办公状态筛选。
- Locations: 输入以逗号分隔的城市或地区(例如 “paris, london”)。
- Countries: 按国家筛选职位。
公司筛选:
- Filter Job Postings by a Selected List of Companies: 这一点会在“按 CRM 公司抓取职位”部分详细说明。
- Exclude Job Postings from a Selected List of Companies: 适合在 lead generation workflow 中排除现有客户;也可以用于避免在新搜索中重复抓取同一批公司。
- Company Type: 可选 Direct Employer and Recruiting Agency(默认)、Direct Employer only 或 Recruiting Agency only。
- Company Industries: 可包含或排除指定行业;当你选择或排除某个行业时,其子行业也会自动包含在内。查看完整行业列表及说明。
- Company Funding Stage: 按创业公司融资阶段筛选。
其他筛选与设置:
- Hiring Manager Info: 仅显示包含招聘负责人信息(姓名、LinkedIn、Title)的职位。
- LinkedIn URL: 仅显示公司拥有 LinkedIn 主页的职位。
- Job Posting Age: 可选择最近 24 小时、3 天、7 天、15 天、1 个月(默认)、2 个月或 6 个月。
- Results Limit: 返回职位数量上限(填 0 时默认返回 1000 条)。
💡 3 个实用的筛选建议
建议 1: 你只为结果付费。所以最好在抓取前就设置好 filters,而不是抓完后再清洗。这样从一开始数据就更干净。
建议 2: 使用 “Hiring Manager Info” filter,可以直接拿到带 LinkedIn 资料的职位。这通常是找到可联系对象最快的方法。
建议 3: 如果你没有启用 “Hiring Manager Info” filter,也没关系——后续可以用 Datablist 的 “Waterfall People Search” 来补充寻找联系人。
排除之前已抓取的公司,避免新搜索重复
你可以通过 “Exclude Job Postings posted by a specific list of Companies” 这个 filter,排除那些你之前已经抓取过的公司,从而避免同一家公司重复出现在新的职位搜索结果中。
在你抓取完一轮职位数据后,只需要把 Exclude Job Postings posted by a specific list of Companies 这个筛选项,关联到你已有数据中的 company website 字段,后续搜索时就能自动排除这些公司。
具体步骤如下:
- 勾选 “Exclude job offers posted by a specific list of companies”
- 选择一个 Collection,其中包含你不想继续抓取职位的公司
- 映射 Datablist Collection Property 到保存公司域名的那一列
开始抓取职位信息
当你设置好所有 filters 后,点击 Continue。
Datablist 会返回以下这些数据字段:
| 分类 | 字段 |
|---|---|
| 职位详情 | Job Title、Job Description、Job Type、Location、Country、Remote Status、Seniority、Salary Range |
| Firmographics | Company Name、Company Website、LinkedIn URL、Employee Count、Company Employee Range、Industry、Founded Year、Revenue |
| 附加信息 | Company Description、City、Country、Job Offers Count、Recent Job Offers Count |
| 职位元数据 | Job Offer ID、Job URL、Job Source URL、Date Posted |
| 招聘负责人信息 | Hiring Manager Name、Hiring Manager Job Title、Hiring Manager LinkedIn Profile |
滚动到页面底部,点击 Run import now。
当 scraper 跑完后,你看到的结果会像这样:
如何按公司名单抓取职位:分步教程
正如前面提到的,这种方式允许你针对已经存在于 Datablist workspace、CRM 或其他数据库中的公司,抓取它们当前发布的职位信息。
要实现这一点,你需要先在 Datablist 的某个 collection 中准备好 公司名称、公司 LinkedIn URL,或者网站 URL。
首先,注册 Datablist。
Import 一份公司名单。
创建一个单独的 Collection。
打开 Job Offers Search。
然后按下面的步骤操作:
- 勾选 “Filter by companies”
- 选择 你刚刚上传的 collection
- 映射 Datablist Collection Property 到包含公司域名的那一列
- 使用我们的 filters 定义你要抓取的职位范围。点击这里查看全部筛选条件。
你也可以用同样的逻辑,指定一个 collection,把其中的公司网站或域名作为排除名单,不让这些公司出现在职位抓取结果中。
💡 3 个职位抓取实用建议
建议 1: 在职位搜索中排除当前活跃客户,避免出现尴尬的触达场景。
建议 2: 把老客户纳入职位搜索范围,有助于重新激活他们。
建议 3: 你不仅可以用域名筛选或排除公司,也可以直接使用网站 URL 和公司名称。
全部设置完成后,点击 Continue。
接着,滚动到页面底部,点击 Run import now。
就是这么简单。大约 2 到 5 分钟后,Datablist 就会把从 19 个招聘网站抓取到的职位结果返回给你。
📘 使用 Datablist 抓取职位的价格
Datablist 采用 credit 计费模式。抓取 1 条职位信息会消耗 10 Credits。
举个简单的计算例子:
如果你订阅 Datablist 的 starter plan($25/月),再额外充值 $20 获得 20,000 credits,那么你总共会有 25,000 credits。
这意味着你可以抓取 2,500 条职位信息,对于大多数销售、招聘或市场团队来说,这已经是一批相当可观的数据量。
为什么要抓取多个招聘网站,而不是只抓一个?
你听过有人抱怨“我手上的数据太多了”吗?我没听过。因为数据本身就是价值。 大家真正会认同的一点是:并不是所有数据都同样有用,有些有价值,有些则几乎没有意义。
为什么数据来源越多越重要
抓取更多招聘网站, 就意味着你能拿到更多职位信息,也就更有机会从中找到真正有价值的数据。这种更广覆盖的方式,可以确保你不会错过分散在不同平台上的高价值机会。
多招聘网站抓取的核心优势
- 更大的数据量
- 不再只依赖一个来源,而是一次覆盖 15+ 数据源
- 更容易发现目标公司相关的招聘机会
- 更强的商业洞察
- 识别哪些公司有即时需求(招聘行为本身就是强信号)
- 根据企业当前优先事项来筛选 target accounts
- 在 cold email campaign 中,把招聘信号作为 qualification 变量使用
- 更明显的竞争优势
- 如果你是招聘方或猎头,可以更高效地拿下机会
- 如果你服务求职者,也能提供更完整的职位视图
- 更早识别招聘趋势,先于竞争对手行动
- 相比单一平台搜索,获得更全面的市场覆盖
- 在公司扩张和投入增长阶段,更早建立联系
既然你已经知道这些数据为什么有价值,接下来我们看看,拿到这些职位数据之后还能做什么。
职位数据还能怎么用?
没错,Datablist 在招聘网站抓取这件事上确实很强, 但这甚至还不到它能力的 1%。下面给你几个拿到职位数据后可以继续做的方向:
- 用更多信息来 Enrich 公司数据
- 使用 AI Agent 搜索数据库中没有的信息
- 在目标客户公司中找到决策人
- 用 Waterfall Enrichment 查找邮箱和电话号码
- 用 AI 编写个性化邮件
- 分析公司的技术栈
这个清单还可以继续列很长。重点是:Datablist 不只是一个抓取工具,它让你通过一个价格友好的订阅,就能进入完整的 lead generation 生态。
结论
抓取多个招聘网站,本质上是一种非常现实的竞争优势。只要还有机会,你就应该尽早利用起来。Datablist 让获取职位数据这件事变得比多数工具都更简单,而且你甚至可以直接针对 CRM 中已有的公司去搜索它们当前的职位发布情况。
FAQ
抓取职位信息合法吗?
招聘网站抓取在法律上通常处于灰色地带。一般来说,采集公开数据未必违法,但很多招聘网站会在自己的 Terms of Service 中明确禁止抓取。是否合法,取决于你的抓取方式(例如是否尊重 robots.txt)、采集了什么数据,以及你如何使用这些数据。
抓取职位信息是什么意思?
抓取职位信息,是指使用自动化工具从不同网站提取职位列表数据。通常会采集 Job Title、职位描述、公司信息、地点、薪资范围等内容。
最好的职位抓取工具是什么?
Datablist 是一个非常强的职位抓取工具,因为它可以同时聚合 19 个不同招聘网站的职位信息。它支持针对职位详情、公司信息和招聘负责人数据进行精细筛选。除了抓取之外,Datablist 还提供数据 Enrichment、AI 搜索和自动化能力。
ChatGPT 可以直接找职位列表吗?
ChatGPT 不能直接实时从网络上抓取职位列表。它可以提供通用的求职建议,但像 Datablist 这样的专业工具,才是专门为跨平台抓取职位信息而设计的,并且能返回更完整的数据,包括公司信息、薪资信息以及招聘负责人联系方式。
抓取到的职位数据怎么用于 outreach campaign?
职位数据能为定向 outreach campaign 提供非常有价值的商业信号。你可以识别出正在积极招聘的公司(这通常意味着业务增长)、找到决策人、补充联系信息,并结合 AI 根据对方的具体招聘需求生成更个性化的消息。相比泛泛而谈的触达方式,这种做法通常会显著提升回复率。
从招聘网站抓取能拿到哪些数据字段?
像 Datablist 这样的招聘抓取工具,可以提取相当完整的数据,包括职位详情(标题、描述、类型、地点、薪资)、公司信息(名称、官网、LinkedIn、规模、行业)、招聘负责人信息(姓名、Title、LinkedIn),以及发布时间等元数据。这类高密度数据对销售、市场和招聘分析都很有价值。
应该抓取多少个招聘网站?
和只依赖单一来源相比,同时抓取多个招聘网站的效果通常会好得多。像 Datablist 这样的工具可以一次抓取 19 个招聘网站,让你获得更完整的市场覆盖、更多潜在客户机会,也能更早看见招聘趋势,从而先于竞争对手行动。















