重复的公司名称真的让人头大:CRM 里一团乱、报表不准、客户互动记录也更难追踪。

更糟的是,靠人工一个个去改?只会更痛苦。

好消息是:这件事其实可以更简单。

这篇指南会带你用一种更高效的方法,在 CSV/Excel 文件或 CRM 系统中快速找出并合并重复的公司名称。你将学会:

开始把数据收拾干净吧。

Step 1: 导入公司名称名单

先把你的公司名称列表导入 Datablist。

Create a New Collection
Create a New Collection

导入完成后,检查一下数据是否加载正确:公司名称列、以及其他字段有没有对齐。

Company Names Data Preview
Company Names Data Preview

Step 2: 用算法识别重复

使用 Datablist 的 Duplicates Finder 来检测匹配的公司名称。

Open the Duplicates Finder Tool
Open the Duplicates Finder Tool

选择包含公司名称的那一列作为目标字段。

Select Company Name Column
Select Company Name Column

接下来,选择最适合你的去重算法:

  • Smart Algorithm: 适合处理经过规范化(normalization)后的“标准重复”。
Use Smart Matching Algorithm
Use Smart Matching Algorithm
  • Distance Algorithm: 用来找“相似但不完全一致”的名称,比如有轻微拼写差异、空格/符号不同或 typo。你可以设置相似度阈值(默认 80,最低 50)。
Set Distance Matching Threshold
Set Distance Matching Threshold

运行 duplicates check,即可找出匹配的记录。

理解 Company Name Processor

Company Name Processor 是一个在检测重复前,先对公司名称做规范化处理的工具。这一步非常关键,因为同一家公司在你的数据里经常会以不同写法出现。

它会做什么:

  • 移除法律后缀:LLC、Inc.、Ltd. 等
  • 忽略地理词:Europe、USA、UK 等
  • 去掉常见业务词:Partners、Group、Technologies 等

示例:

Original NameNormalized Name
Apple Inc.Apple
Apple USA LLCApple
Apple TechnologiesApple
Microsoft CorporationMicrosoft
Microsoft Ltd. UKMicrosoft

这样一来,“Apple Inc.” 和 “Apple Technologies” 就会被正确识别为重复项。

Step 3: 合并重复的公司记录

重复记录会被自动分组展示。

Review Duplicate Groups
Review Duplicate Groups

Note: 如果你只是想拿到“重复名单”,直接导出匹配结果即可;如果你要合并重复项,请继续往下。

处理冲突字段

当同一个字段在多条重复记录里出现了不同值,就会被标记为冲突字段(conflicting property)。

比如两条记录的电话、地址、官网不一致,你就需要决定合并规则。

Datablist 提供两种合并方式:

  • Combine Values: 把不同重复记录里的多个值合并到主记录同一字段里(例如合并多个电话号码)。
  • Keep One Value and Delete the Others: 只保留其中一条记录的值,其它重复记录在该字段的值会被丢弃(例如保留信息最完整的地址)。

有一个 Shortcuts Link 可以让你把同样的合并规则一键应用到所有冲突字段。

Set Merging Rules
Set Merging Rules

选择 Master Record(主记录)

系统会选定一条记录作为“master”,其它重复记录会合并进这条记录。

你可以按以下规则选择:

  • Most Complete: 选择已填字段最多的那条记录。
  • Last Updated: 选择最近一次被修改的记录。
  • First Created: 选择创建时间最早的记录。
  • Highest Value: 选择某个指定字段数值最高的记录(如果并列,用最新的记录打破平局)。
  • Lowest Value: 选择某个指定字段数值最低的记录(如果并列,用最新的记录打破平局)。
  • Matching Value: 选择在某个字段里包含指定值的记录;不包含该值的记录不会被合并。

设置好合并规则和 master record 选择方式后,刷新预览(preview),先看一遍实际合并后的效果,再确认执行。

Refresh Preview
Refresh Preview

预览会显示每组重复项里:哪些值会被删除、哪些会被合并、以及最终哪条是 master record。

Preview Merging Results
Preview Merging Results

如果你有更精细的需求,也可以手动合并指定记录。

当条件允许时,选择合适的选项启动自动合并流程(例如 “Auto-merge duplicates when possible”)。

Complete the Merge
Complete the Merge

合并完成后,你的数据就干净了,可以直接导出。

要导出去重后的数据,在顶部点击 “Export”,支持导出 CSV 或 Excel。

Export the Cleaned List
Export the Cleaned List

总结

清理重复公司名称,不一定要搞得很崩溃。

用对工具和方法,你可以:

  • 避免数据不一致
  • 提升 CRM 使用效率
  • 节省大量人工核对时间

从今天开始,持续把公司数据维护得干净、可用、好运营。