按数据含义拆分 CSV,而不只是按块大小切分
许多 CSV splitter 工具只支持“每 1,000 行拆一份”。但真实导出往往更复杂。有时你需要每个国家一个文件、每个月一个文件、enterprise accounts 单独一个文件,或给所有未匹配任何条件的行准备一个兜底文件。这个工具正是为这种真实场景而设计。
CSV 分隔符、带引号的换行、重复表头和编码都会自动处理。
预览并下载
下载前可查看文件数量、警告信息以及每个输出结果的预览。
构建拆分后即可预览
选择拆分模式,调整设置,并在下载前预览输出文件。
按数据含义拆分 CSV,而不只是按块大小切分
许多 CSV splitter 工具只支持“每 1,000 行拆一份”。但真实导出往往更复杂。有时你需要每个国家一个文件、每个月一个文件、enterprise accounts 单独一个文件,或给所有未匹配任何条件的行准备一个兜底文件。这个工具正是为这种真实场景而设计。
拆分前先做智能分析
工具会自动检测编码、分隔符、重复表头、空列、大文本字段,以及适合分组的低基数字段。这样你无需靠猜,就能更轻松地选择实用的拆分方式。
当拆分存在风险时,你还会收到警告:例如输出文件过多、产生太多过小文件,或者某一个超大分组远远超过其他分组。
专为大型真实 CSV 导出打造
大文件始终保留在本地浏览器侧处理。你可以在下载前预览结果,只保留需要的列,并导出单个文件或打包为 ZIP 压缩包的多个文件。
这非常适合用于 outreach 批次、按国家交接、CRM 清理、合规审查以及按月历史数据切片。
复杂设置使用指南
有些拆分设置功能很强,但初看并不直观。工具中的帮助图标会跳转到下方对应说明,让你在预览拆分结果之前,先清楚了解某个设置到底会改变什么。
按行、重叠行与按大小分块
这些是最快的拆分模式;当你只是需要更小的文件时,通常也是最稳妥的选择。
每个文件的行数会让每个输出文件大致拥有相同的行数。当下游工具更关注 batch 大小,而不是类别或业务含义时,这种方式最合适。
重叠行会在文件边界重复少量行。只有当下一批数据需要上一批的少量上下文时,才建议使用。
保持分组行不被拆散可避免同一个 account、company 或 order 被拆到多个文件中。当同一实体相关的行必须保留在一起时,这一点非常重要。
每个文件的最大大小适用于上传限制场景。它会尽量控制在指定字节数以内,但由于每行长度可能不同,最后一个文件或部分文件的大小分布,仍可能没有按行拆分那样均匀。
分组输出与稀有值处理
按值拆分最适合这样的场景:每个国家、负责人、状态或来源单独一个 CSV,更便于审查或交接。
按列拆分会根据不同的值或值组合生成输出文件。只选一列时,输出更简单;选择两列或更多列时,文件划分会更细。
稀有值处理适合那些一次性值过多、会产生大量小文件的情况。你可以只保留最大的几个分组,并将其余合并到“other”文件中。
同时按文件大小拆分大分组适用于某一类别远大于其他类别时。它保留分组逻辑,同时避免单个超大文件主导整个导出结果。
规则、首个匹配与未匹配行
当文件去向取决于业务逻辑,而不是某个简单分组列时,基于规则的拆分尤其有用。
仅首个匹配表示一行数据在匹配到第一条规则后就停止继续匹配。只有在你明确希望同一行被复制到多个输出文件时,才应关闭此选项。
将未匹配行保留到单独文件可确保那些不满足任何规则的行,仍然会被保存在独立导出文件中。
未匹配行文件名就是这个兜底文件的名称。当你希望输出类似 needs-review.csv 或 no-rule-match.csv 这样清晰的文件名时,这项设置会很有帮助。
日期、导出设置与更干净的输出文件
当输入数据较脏,或导出文件名需要适配现有 workflow 时,这些设置尤其重要。
日期格式用于处理存在歧义的日期列。如果检测器判断错误,请在按月、按年或按周分组前,手动指定预期格式。
无效日期让你决定错误值应被跳过,还是移入单独文件。这比悄悄丢失数据行更安全。
文件名模式控制最终输出文件名。当你的 batch 需要可预测编号时,可使用 {index} 和 {label} 等变量。
输出中保留的列可在拆分前删除不必要的列。这样导出结果会更轻量、更干净,尤其适用于原始 CSV 中包含你不希望传递到下游的辅助列时。
这个工具可处理的边缘场景
真实的 CSV 导出很少是干净整齐的。这个工具专门为应对那些常常让简单 splitter 失效的烦人情况而设计。
带引号的单元格、内嵌逗号与换行符
不会仅因为带引号的单元格中包含逗号或换行,就把数据行错误拆开。
解析器会保持带引号的 CSV 值完整,因此地址、备注或长文本字段不会在拆分过程中被误切成伪造的数据行。
重复表头、空列与投影输出
在 CRM、财务和客服导出中,混乱表头和超大导出文件非常常见。
重复表头会被标准化处理,从而保证比较逻辑仍然有效。系统也可以识别空列,而 projection 功能允许你在生成输出前先移除不需要的列。
大文件与惰性预览
预览应该帮助你做决定,而不是阻碍你处理大文件。
对于按行拆分的大文件,工具可保持预览足够轻量,并只预加载第一个输出文件。后续预览与下载会在需要时再按需生成。
无效日期、未匹配规则与不均匀分组
splitter 会让边缘情况的数据行保持可见,而不是悄悄丢弃。
包含无效日期的行可以进入单独文件;未匹配任何规则的行可以保留在独立导出中;当某个分组明显大于其他分组时,分组拆分也会向你发出警告。
按国家或状态拆分
当你希望每个国家、负责人、状态、来源或任何低基数字段各生成一个 CSV 时,可使用按分组值拆分。
id,name,country,status 1,Alice,FR,active 2,Bob,FR,inactive 3,Carol,US,active 4,Dan,DE,lead
split-fr.csv id,name,country,status 1,Alice,FR,active 2,Bob,FR,inactive split-us.csv id,name,country,status 3,Carol,US,active
构建基于规则的输出文件
条件规则可帮助你定义实用的目标文件,例如 enterprise accounts、Gmail 地址,或任何未命中规则的兜底数据行。
company_size,country,email 120,US,alice@gmail.com 25,FR,bob@startup.test 300,DE,ops@datablist.com
enterprise.csv company_size,country,email 120,US,alice@gmail.com 300,DE,ops@datablist.com gmail.csv company_size,country,email 120,US,alice@gmail.com
我可以按列值拆分 CSV 吗?
可以。选择一个或多个列,预览分组数量,并可选择限制输出文件数量,再将稀有值合并到“other”文件中。
我可以按文件大小拆分 CSV 吗?
可以。为每个文件设置目标字节大小。当其他工具有上传限制时,这很有用。如果每行长度差异过大,预览会提示估算可能不够可靠。
我可以按月份或年份拆分 CSV 吗?
可以。选择日期列,按月、按年或按 ISO 周拆分,并决定无效日期是进入单独文件还是直接跳过。
这个工具会生成 ZIP 压缩包吗?
会。单一输出的拆分结果会下载为 CSV,多文件拆分则会下载为 ZIP,以便更好地管理大型分段导出。