重复的公司名称真的让人头大:CRM 里一团乱、报表不准、客户互动记录也更难追踪。
更糟的是,靠人工一个个去改?只会更痛苦。
好消息是:这件事其实可以更简单。
这篇指南会带你用一种更高效的方法,在 CSV/Excel 文件或 CRM 系统中快速找出并合并重复的公司名称。你将学会:
开始把数据收拾干净吧。
Step 1: 导入公司名称名单
先把你的公司名称列表导入 Datablist。
导入完成后,检查一下数据是否加载正确:公司名称列、以及其他字段有没有对齐。
Step 2: 用算法识别重复
使用 Datablist 的 Duplicates Finder 来检测匹配的公司名称。
选择包含公司名称的那一列作为目标字段。
接下来,选择最适合你的去重算法:
- Smart Algorithm: 适合处理经过规范化(normalization)后的“标准重复”。
- Distance Algorithm: 用来找“相似但不完全一致”的名称,比如有轻微拼写差异、空格/符号不同或 typo。你可以设置相似度阈值(默认 80,最低 50)。
运行 duplicates check,即可找出匹配的记录。
理解 Company Name Processor
Company Name Processor 是一个在检测重复前,先对公司名称做规范化处理的工具。这一步非常关键,因为同一家公司在你的数据里经常会以不同写法出现。
它会做什么:
- 移除法律后缀:LLC、Inc.、Ltd. 等
- 忽略地理词:Europe、USA、UK 等
- 去掉常见业务词:Partners、Group、Technologies 等
示例:
| Original Name | Normalized Name |
|---|---|
| Apple Inc. | Apple |
| Apple USA LLC | Apple |
| Apple Technologies | Apple |
| Microsoft Corporation | Microsoft |
| Microsoft Ltd. UK | Microsoft |
这样一来,“Apple Inc.” 和 “Apple Technologies” 就会被正确识别为重复项。
Step 3: 合并重复的公司记录
重复记录会被自动分组展示。
Note: 如果你只是想拿到“重复名单”,直接导出匹配结果即可;如果你要合并重复项,请继续往下。
处理冲突字段
当同一个字段在多条重复记录里出现了不同值,就会被标记为冲突字段(conflicting property)。
比如两条记录的电话、地址、官网不一致,你就需要决定合并规则。
Datablist 提供两种合并方式:
- Combine Values: 把不同重复记录里的多个值合并到主记录同一字段里(例如合并多个电话号码)。
- Keep One Value and Delete the Others: 只保留其中一条记录的值,其它重复记录在该字段的值会被丢弃(例如保留信息最完整的地址)。
有一个 Shortcuts Link 可以让你把同样的合并规则一键应用到所有冲突字段。
选择 Master Record(主记录)
系统会选定一条记录作为“master”,其它重复记录会合并进这条记录。
你可以按以下规则选择:
- Most Complete: 选择已填字段最多的那条记录。
- Last Updated: 选择最近一次被修改的记录。
- First Created: 选择创建时间最早的记录。
- Highest Value: 选择某个指定字段数值最高的记录(如果并列,用最新的记录打破平局)。
- Lowest Value: 选择某个指定字段数值最低的记录(如果并列,用最新的记录打破平局)。
- Matching Value: 选择在某个字段里包含指定值的记录;不包含该值的记录不会被合并。
设置好合并规则和 master record 选择方式后,刷新预览(preview),先看一遍实际合并后的效果,再确认执行。
预览会显示每组重复项里:哪些值会被删除、哪些会被合并、以及最终哪条是 master record。
如果你有更精细的需求,也可以手动合并指定记录。
当条件允许时,选择合适的选项启动自动合并流程(例如 “Auto-merge duplicates when possible”)。
合并完成后,你的数据就干净了,可以直接导出。
要导出去重后的数据,在顶部点击 “Export”,支持导出 CSV 或 Excel。
总结
清理重复公司名称,不一定要搞得很崩溃。
用对工具和方法,你可以:
- 避免数据不一致
- 提升 CRM 使用效率
- 节省大量人工核对时间
从今天开始,持续把公司数据维护得干净、可用、好运营。













