按数据含义拆分 CSV,而不只是按块大小切分

许多 CSV splitter 工具只支持“每 1,000 行拆一份”。但真实导出往往更复杂。有时你需要每个国家一个文件、每个月一个文件、enterprise accounts 单独一个文件,或给所有未匹配任何条件的行准备一个兜底文件。这个工具正是为这种真实场景而设计。

上传 CSV 或粘贴到下方

CSV 分隔符、带引号的换行、重复表头和编码都会自动处理。

粘贴或拖放文件
粘贴 CSV
适合快速测试,或当文件已经在你的剪贴板中时使用。

预览并下载

下载前可查看文件数量、警告信息以及每个输出结果的预览。

构建拆分后即可预览

选择拆分模式,调整设置,并在下载前预览输出文件。

按数据含义拆分 CSV,而不只是按块大小切分

许多 CSV splitter 工具只支持“每 1,000 行拆一份”。但真实导出往往更复杂。有时你需要每个国家一个文件、每个月一个文件、enterprise accounts 单独一个文件,或给所有未匹配任何条件的行准备一个兜底文件。这个工具正是为这种真实场景而设计。

拆分前先做智能分析

工具会自动检测编码、分隔符、重复表头、空列、大文本字段,以及适合分组的低基数字段。这样你无需靠猜,就能更轻松地选择实用的拆分方式。

当拆分存在风险时,你还会收到警告:例如输出文件过多、产生太多过小文件,或者某一个超大分组远远超过其他分组。

专为大型真实 CSV 导出打造

大文件始终保留在本地浏览器侧处理。你可以在下载前预览结果,只保留需要的列,并导出单个文件或打包为 ZIP 压缩包的多个文件。

这非常适合用于 outreach 批次、按国家交接、CRM 清理、合规审查以及按月历史数据切片。

复杂设置使用指南

有些拆分设置功能很强,但初看并不直观。工具中的帮助图标会跳转到下方对应说明,让你在预览拆分结果之前,先清楚了解某个设置到底会改变什么。

按行、重叠行与按大小分块

这些是最快的拆分模式;当你只是需要更小的文件时,通常也是最稳妥的选择。

每个文件的行数会让每个输出文件大致拥有相同的行数。当下游工具更关注 batch 大小,而不是类别或业务含义时,这种方式最合适。

重叠行会在文件边界重复少量行。只有当下一批数据需要上一批的少量上下文时,才建议使用。

保持分组行不被拆散可避免同一个 account、company 或 order 被拆到多个文件中。当同一实体相关的行必须保留在一起时,这一点非常重要。

每个文件的最大大小适用于上传限制场景。它会尽量控制在指定字节数以内,但由于每行长度可能不同,最后一个文件或部分文件的大小分布,仍可能没有按行拆分那样均匀。

分组输出与稀有值处理

按值拆分最适合这样的场景:每个国家、负责人、状态或来源单独一个 CSV,更便于审查或交接。

按列拆分会根据不同的值或值组合生成输出文件。只选一列时,输出更简单;选择两列或更多列时,文件划分会更细。

稀有值处理适合那些一次性值过多、会产生大量小文件的情况。你可以只保留最大的几个分组,并将其余合并到“other”文件中。

同时按文件大小拆分大分组适用于某一类别远大于其他类别时。它保留分组逻辑,同时避免单个超大文件主导整个导出结果。

规则、首个匹配与未匹配行

当文件去向取决于业务逻辑,而不是某个简单分组列时,基于规则的拆分尤其有用。

仅首个匹配表示一行数据在匹配到第一条规则后就停止继续匹配。只有在你明确希望同一行被复制到多个输出文件时,才应关闭此选项。

将未匹配行保留到单独文件可确保那些不满足任何规则的行,仍然会被保存在独立导出文件中。

未匹配行文件名就是这个兜底文件的名称。当你希望输出类似 needs-review.csvno-rule-match.csv 这样清晰的文件名时,这项设置会很有帮助。

日期、导出设置与更干净的输出文件

当输入数据较脏,或导出文件名需要适配现有 workflow 时,这些设置尤其重要。

日期格式用于处理存在歧义的日期列。如果检测器判断错误,请在按月、按年或按周分组前,手动指定预期格式。

无效日期让你决定错误值应被跳过,还是移入单独文件。这比悄悄丢失数据行更安全。

文件名模式控制最终输出文件名。当你的 batch 需要可预测编号时,可使用 {index}{label} 等变量。

输出中保留的列可在拆分前删除不必要的列。这样导出结果会更轻量、更干净,尤其适用于原始 CSV 中包含你不希望传递到下游的辅助列时。

这个工具可处理的边缘场景

真实的 CSV 导出很少是干净整齐的。这个工具专门为应对那些常常让简单 splitter 失效的烦人情况而设计。

带引号的单元格、内嵌逗号与换行符

不会仅因为带引号的单元格中包含逗号或换行,就把数据行错误拆开。

解析器会保持带引号的 CSV 值完整,因此地址、备注或长文本字段不会在拆分过程中被误切成伪造的数据行。

重复表头、空列与投影输出

在 CRM、财务和客服导出中,混乱表头和超大导出文件非常常见。

重复表头会被标准化处理,从而保证比较逻辑仍然有效。系统也可以识别空列,而 projection 功能允许你在生成输出前先移除不需要的列。

大文件与惰性预览

预览应该帮助你做决定,而不是阻碍你处理大文件。

对于按行拆分的大文件,工具可保持预览足够轻量,并只预加载第一个输出文件。后续预览与下载会在需要时再按需生成。

无效日期、未匹配规则与不均匀分组

splitter 会让边缘情况的数据行保持可见,而不是悄悄丢弃。

包含无效日期的行可以进入单独文件;未匹配任何规则的行可以保留在独立导出中;当某个分组明显大于其他分组时,分组拆分也会向你发出警告。

按国家或状态拆分

当你希望每个国家、负责人、状态、来源或任何低基数字段各生成一个 CSV 时,可使用按分组值拆分。

Input
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive
3,Carol,US,active
4,Dan,DE,lead
Output
split-fr.csv
id,name,country,status
1,Alice,FR,active
2,Bob,FR,inactive

split-us.csv
id,name,country,status
3,Carol,US,active

构建基于规则的输出文件

条件规则可帮助你定义实用的目标文件,例如 enterprise accounts、Gmail 地址,或任何未命中规则的兜底数据行。

Input
company_size,country,email
120,US,alice@gmail.com
25,FR,bob@startup.test
300,DE,ops@datablist.com
Output
enterprise.csv
company_size,country,email
120,US,alice@gmail.com
300,DE,ops@datablist.com

gmail.csv
company_size,country,email
120,US,alice@gmail.com

我可以按列值拆分 CSV 吗?

可以。选择一个或多个列,预览分组数量,并可选择限制输出文件数量,再将稀有值合并到“other”文件中。

我可以按文件大小拆分 CSV 吗?

可以。为每个文件设置目标字节大小。当其他工具有上传限制时,这很有用。如果每行长度差异过大,预览会提示估算可能不够可靠。

我可以按月份或年份拆分 CSV 吗?

可以。选择日期列,按月、按年或按 ISO 周拆分,并决定无效日期是进入单独文件还是直接跳过。

这个工具会生成 ZIP 压缩包吗?

会。单一输出的拆分结果会下载为 CSV,多文件拆分则会下载为 ZIP,以便更好地管理大型分段导出。

相关工具