数据会“腐烂”。公司会倒闭、被收购、或改名换品牌。如果你的 CRM 或 prospect list 几个月都没人碰,它很快就不准了。

你会发出大量退信的邮件;拨打根本不存在的号码;把时间浪费在早就关门的组织上。

判断一个公司是否还“活着”,最快的 proxy 就是看它的网站还在不在。 网站正常在线,通常代表业务还在运转;域名被停放(parked)或直接 404,则基本说明有问题。

下面我们会用 Datablist 的 “Website Status & Parked Domain Checker” 来批量验证一份公司名单。它会逐条测试 URL,并把每个网址到底发生了什么清清楚楚地返回给你。

这个工具能做什么

Website Status checker 会分析你列表里的每一个 URL:实际访问页面,并返回可操作的结果数据:

  • Online: 网站可正常打开。
  • Redirected: 网站发生重定向,公司可能换了域名(例如 rebrand)。
  • Parked: 域名过期或正在出售,企业大概率已经不在了。
  • Unreachable: 服务器不可达,或域名本身不存在。

同时它还会提供 HTTP Status Code(例如 404、503)、重定向后的 URL,以及 Page Title(页面标题),方便你识别是不是占位页/停放页。

批量检查网站状态:分步教程

第 1 步:导入你的数据

打开 Datablist,新建一个 collection。导入包含公司列表的 CSV 或 Excel 文件。

Load file into Datablist collection
Load file into Datablist collection

你只需要一列网站 URL 就够了。若你还有公司名、邮箱等其他字段也建议保留——工具会按“整行”处理。

第 2 步:打开 Status Checker

点击 “Enrich” 按钮,在库里搜索 “Website Status & Parked Domain Checker”。

Open Website Status and Parked Domain Checker enrichment
Open Website Status and Parked Domain Checker enrichment

这个 enrichment 会连接互联网,对每个站点进行实时 ping/请求检测。

第 3 步:配置参数并映射网站字段

先看一下配置项。你会看到 Proxy 设置,默认是 “Retry with proxy on protected status”。

建议保持开启。它对现代公司官网的检查非常关键:如果网站对首次请求做了防护(返回 403 Forbidden),工具会自动用 premium proxy 重新尝试,从而绕过保护拿到真实状态。

接着做字段映射(map)。选择你文件中存放网站 URL 的那一列。

Map website field to enrichment input
Map website field to enrichment input

即使你的 URL 比较乱(缺少 “http” 或 “www”),也没关系。工具会尽量兼容各种格式去连接。

第 4 步:选择输出字段

决定你要把哪些结果写回表格。我们建议全选输出字段,因为每一项都能带来额外价值。

Select enrichment output fields
Select enrichment output fields
  • Website Status 是最核心的结果列。
  • Final URL 用来记录重定向后的目标地址。
  • Error MessageHTTP Status Code 能帮助你理解为什么不可达,方便排查。

第 5 步:打开 Instant Run

不需要一上来就盲跑全量数据。先用 “Instant Run” 测一下配置是否正确。

Open instant run menu
Open instant run menu

第 6 步:用小样本测试

先对前 10 条运行检查。这样更省 credits,也能确认字段映射没问题。

重要提示

如果你要检查几百个以上的网站,请开启 “Run in Async”。

Run enrichment on sample rows
Run enrichment on sample rows

工具会实时处理这些行。

Enrichment running status
Enrichment running status

第 7 步:检查结果并扩展到全量

在数据表里查看结果,重点看 “Website Status” 这一列。

Review website status results
Review website status results

如果是 “Online”,公司大概率仍在正常运营。 如果是 “Redirected”,公司可能迁移到了新域名。 如果是 “Parked” 或 “Unreachable”,你基本就定位到 dead lead 了。

确认无误后,点击 “Run on remaining items” 处理整个数据库。

Run enrichment on remaining rows
Run enrichment on remaining rows

如何解读结果

如何处理重定向

公司经常会 rebrand。如果 URL 发生重定向,Final URL 会显示新的地址。 把这个新域名更新回你的 CRM。这个小动作经常能显著降低 bounce rate——因为改名之后,旧域名的邮箱往往也会逐步失效。

如何识别停放域名(Parked)

“Parked” 基本是业务停止的强信号:站长不再续费托管/网站服务,域名注册商把页面换成广告或出售页。建议立刻把这类记录从你的 outbound 列表里移除。

如何应对 Unreachable

“Unreachable” 表示连接失败。可能是临时故障,也可能服务器真的没了。如果你在清洗 scraped data,通常会遇到不少这种情况。

总结

检查网站状态,是验证公司名单最快的办法之一:你能快速剔除无效数据、发现改名/迁域的机会,把精力集中在真正还存在的企业上。

常见使用场景

CRM 数据卫生(CRM Hygiene)

建议每个季度把全量客户跑一遍。把网站已失效的账号标记给客户成功/客户管理团队跟进,确认是客户停业,还是只是忘了续费网站托管。

清洗获客名单(Prospect Lists)

在把名单导入销售触达工具之前,先验证网站状态。清掉“死公司”能保护你的域名信誉(domain reputation),也能避免把邮件发到不存在的服务器上。想系统了解这块,可以看我们的 data cleaning 指南。

发现改名与收购线索(Rebranding Detection)

利用 Redirected 状态,你可以快速找到改名换域名的公司。比如 company-a.com 跳转到 holding-group-b.com,这就是很有价值的情报——你可以在 cold outreach 里顺带提到收购或 rebrand,提高回复率。

FAQ

这个工具真的会访问网站吗?

会。它会对 URL 发起真实的 HTTP request,验证响应并分析页面内容。

它能识别 parked domain 吗?

可以。它会通过分析 DNS 记录与页面标题,识别常见注册商(例如 GoDaddy、Namecheap)的停放页。

如果网站会封 bot 怎么办?

工具会自动处理。开启 “Retry with proxy” 后,如果网站阻止首次检测(通常返回 403),系统会用 residential proxy 重试,从而验证那些常见会拦截自动化 scraper 的活跃网站。