本地化(Localization)几乎是内容出海的必选项:想让国际用户真正看懂并愿意用你的内容,你就需要多语言版本。现在的**机器翻译(Machine Translation)**借助机器学习,效果已经相当不错,成本也远低于人工翻译。
CSV 文件非常适合存储结构化数据,大多数应用都会把数据导出为这种通用格式。
比如商品目录经常会导出成CSV 文件,CMS 文章也能提取成扁平文件(flat file)。
👉 CSV 基本已经成了应用之间交换通用数据的事实标准。
但 CSV 不能像普通文本那样“一键全选翻译”。因为有些列是姓名、日期、ID 等,必须保持原样。那到底怎么做到“只翻译某几列”,同时不破坏其他列?
下面我会用 Datablist 演示怎么在线翻译 CSV,而且比 Google Translate 或 DeepL 便宜 35 倍。
本指南会按下面步骤走:
开始吧。
Step 1: 导入你的 CSV 文件
这篇教程的所有操作都会在线完成,用的是 Datablist 的 CSV Viewer and Editor。
我会用一个“Book Summaries(书籍摘要)”的 CSV 来做示例。演示 CSV 文件在这里。
先创建一个新的 collection(集合)。collection 用来承载你的 CSV 数据。点击侧边栏的 +,或者首页的快捷入口“Start with a CSV/Excel file”。
如果你用的是侧边栏的“+”,请选择 “Import CSV/Excel” 进入 CSV 导入器。
导入 CSV 后,Datablist 会列出识别到的列,并自动分析每一列的数据类型。在你要翻译的那一列上,如果还没选中,请把数据类型切到 “Long Text”。
用 “Long Text” 会更适合管理长文本,编辑体验也更好。
确认数据无误后,将 CSV 导入到 Datablist。
Step 2: 选择要翻译的行
Datablist 通过 “Enrichment” 来批量处理数据。你可以直接在表格上enrich Facebook leads,也可以clean email listings。
Datablist 内置了 3 个翻译 provider:Google Translate、Deepl Translate、以及 ChatGPT Translator。你可以选其一,也可以都试一遍,看看哪一个最适合你的文本风格。
重要 - Enrichment 仅对已注册用户开放。免费注册后就能开始翻译 CSV。
Enrichment 在顶部的 “Enrich” 菜单里。它既可以对全部数据运行,也可以只对选中的行运行。
翻译全部行
默认情况下,你通过 “Enrich” 触发的动作会对所有行生效。也就是说,翻译会覆盖列表中的所有条目。
只翻译部分行
如果你只想翻译其中一部分,按住鼠标点击并拖动复选框即可选择多行。
Step 3: 在线翻译你的 CSV 文件
想看到 Datablist 支持的机器翻译工具,在 enrichment 列表中点击 “Translations” 分类进行筛选即可。
下面是 3 个翻译工具的快捷入口:
用 Google Translate 翻译 CSV
在 enrichment 列表里选择 “Google Translate” 打开配置抽屉(drawer)。
开始翻译前,你需要配置参数并指定输入列。
在 settings 中,你需要设置:
- Source Language - 可选 - **不填的话会自动识别语言。**如果你的文本里混有多种语言,建议保持不选。
- Target Language - 必填 - 选择目标语言。语言名称用英文显示。查看支持的语言
然后在 “Input Property” 里选择你要翻译的那一列。**只有这一列会被翻译,其他列不会动。**这点非常关键:它让你能精准翻译某一列,同时保留姓名、日期、ID 等字段不变。
本例里,书籍摘要在 “Description” 这一列,所以我选择 “Description”。
📕 重要
只有 Text/Long Text 类型的列可以翻译,其他数据类型会被忽略。
点击 “Continue to outputs configuration” 来设置翻译结果要写到哪一列。
这里点击 “+” 创建一个新列(property)。
📘 说明
你的源列(input)不会被更新。输出列不能等于输入列,否则会覆盖原数据。最后一步你可以再统一调整列名。
配置完成后,先点 “Run on first 10 items” 对前 10 条做测试翻译。
这一步非常有用:可以快速验证 Source Language、输入列、输出列是否设置正确。翻译后滚动表格,查看结果列是否正常。如果翻译不对,优先检查 “Source Language” 是否应该留空,以及输入列是否选错。
如果前 10 条效果满意,再点击 “Run enrichment on all items” 批量处理剩余数据。
用 Deepl 翻译 CSV
Deepl 是 2017 年上线的机器翻译服务,以准确度著称。技术上,Deepl 使用的是一种不同的神经网络:卷积神经网络(CNN)。它在处理长文本时更擅长保留上下文,因此 Deepl 通常更适合长段落;而 Google Translate 在句子之间关联性不强的文本里也表现不错。
使用 Deepl 的流程与 Google Translate 完全一致,只需要在 enrichment 里改选 Deepl 即可。
用 ChatGPT 翻译 CSV(便宜 35 倍!)
ChatGPT 是由 OpenAI 开发的语言模型,翻译只是它众多用例之一。它能理解语义细节与上下文,因此往往能给出更“通顺”的译文,而不是逐词硬翻。
ChatGPT 有不同模型,价格也不一样。
2024 年 7 月 18 日,OpenAI 发布了 GPT-4o mini:性价比极高、翻译质量也很不错。
从 2025 年 4 月 14 日起,GPT-4.1 系列上线——速度更快、context window 更大。其中 GPT-4.1 nano 是最便宜的翻译选择。
与 Google Translate 或 Deepl 相比,ChatGPT 便宜 35 倍,质量也几乎接近 Google Translate。Deepl 的整体质量依然略胜一筹,但差距不大。
我的建议是先抽一部分数据试跑,评估翻译效果。如果你也觉得结果足够准确,那么 ChatGPT 会是非常划算的 CSV 翻译方案。
如何选择不同的 ChatGPT 模型来翻译?
Datablist 支持在翻译 CSV 时选择不同的 ChatGPT 模型。
当前可用模型包括:
- GPT-4.1 – 最新旗舰模型。更快、更聪明,上下文理解更强。适合结构复杂或有格式要求的高质量翻译;价格也比上一代 GPT 4o 旗舰更便宜一点。
- GPT-4.1 mini – 比 GPT-4o mini 更贵。
- GPT-4.1 nano – **最便宜的选项。**适合基础、高频、批量翻译。对细微语境不如大模型敏感,但用于商品描述或简单文本完全够用。
- GPT-4o – 稳定可靠,但大约比 GPT-4o mini 贵 20 倍。
- GPT-4o mini - Default – 默认模型。对多数翻译任务依然很强,价格/质量比很优秀。
💡 小提示
GPT-4.1 nano 是更便宜的模式,价格比 Google Translate 或 DeepL 低 35 倍以上。
选择不同模型的方法:
- 在 “Translate with OpenAI/ChatGPT” enrichment 里点击 “Advanced Settings”。
- 在 “GPT Model” 下拉中选择你要用的版本。
不同模型各有取舍:越贵通常越懂语境;越便宜(比如 GPT-4.1 nano)则能让你用极低成本翻译海量数据。
💡 我的建议?
先从 GPT-4.1 nano 开始,抽几行做测试。效果满意就直接跑全量,省很多钱;如果不满意,再切到 GPT-4o 获取更好的结果。
如何处理复杂翻译?
有些文本很好翻,有些……真的很难。
你可能在翻译这些内容时踩过坑:
- HTML 代码
- JSON 格式内容
- 带大量英文术语的 business 文案
- 产品名或公司名
- 表单 label、placeholder
- 带变量的句子,比如
{first_name}或[LINK]
这种我一般叫 “别把它弄坏(don’t break it)”翻译:你想换语言,但不想让结构、变量、关键术语发生任何变化。
这时就需要 custom instructions(自定义指令)。
在 Datablist 使用 “Translate with OpenAI/ChatGPT” 时,你可以写自定义指令,它会随请求一起发送给 ChatGPT,用来控制翻译规则。
下面给你几个真实场景的例子。
1. 不要翻译 business 术语
很多时候你希望保留 “API”“CRM”“lead”“SaaS” 这类词。
2. 保持 HTML 与变量不被破坏
如果文本里包含 HTML tag 或变量,不说明的话,ChatGPT 可能会改动它们。
👉 Input:
<p>Hello {first_name}, welcome to <b>Our App</b>!</p>
👉 Custom instruction:
✅ Result (Spanish):
<p>Hola {first_name}, bienvenido a <b>Nuestra App</b>!</p>
3. 翻译 JSON 或结构化内容
JSON 很脆弱:引号错一个,整个 JSON 就无效了。JSON 经常用于商品目录,也常见于应用多语言。
👉 Input:
{
"title": "Your payment was successful",
"description": "You can now access premium features."
}
👉 Custom instruction:
✅ Result (French):
{
"title": "Votre paiement a été effectué avec succès",
"description": "Vous pouvez maintenant accéder aux fonctionnalités premium."
}
4. 保留产品名或品牌名
比如你的产品叫 Formly,你不希望它被翻译。
👉 Custom instruction:
5. 调整语气或正式程度
例如:德语用正式的 “Sie”,西语用更口语的 “tú”。
👉 Custom instruction:
小技巧:把多条指令叠加使用
你可以混合多条规则。
👉 Example:
custom instructions 的价值在于:没有它,模型只能“猜”;有了它,翻译规则你说了算。
分批处理:一步步跑完整个列表
CSV 很大?或者你在测试不同 instructions / 不同模型?不需要一次跑完。
你可以每次只处理一小批。
用 “Number of items to process” 来控制每次运行处理的行数。
从上次进度继续
当你处理完一批后,之后可以再回来继续跑。
点击 enrichment 的结果列,然后选择 “Run Enrichment”。
它会用你上次的设置重新打开 drawer。
默认会跳过已经处理过的行,这对“分批跑完”非常省心。
如果你想重跑全部数据或重跑某些行,使用 “Run on” 选项选择要处理的范围。
想重做之前的翻译结果?
比如你想换一个 GPT 模型,或更新 custom instructions。
这时把 “Existing data rule” 改成 Overwrite existing data in output properties。
这样旧结果会被新结果覆盖。
💡 Use case tip
测试多个 prompt 时,每个先跑小批量;对比结果;选出最优;再跑全量。
Step 4: 校对你的翻译结果
翻译后的文本会保存在输出列 “Translated Texts” 里。
自动翻译很方便,但也更容易出错,所以人工校对很重要。
建议重点检查:
- 人名、品牌名、行业术语 - Google 可能会把产品名或技术词翻掉。提示:首字母大写的词通常不会被翻译,但也不是绝对。
- 变量占位符 - 如果文本用于软件或模板,确认
{name}这类变量没有被改动。
想快速阅读并编辑翻译结果,选中单元格后按 Enter 进入编辑模式。
或者打开详情抽屉进行查看。
Step 5: 导出翻译结果为 CSV 或 Excel
最后一步是把数据导出为文件,再导入回你的应用。你可以参考文档:export your data in CSV or Excel files。
如果你希望导出的 CSV 列顺序与列名和最初导入时一致:需要调整 properties(列)来匹配原始列。
点击 properties 管理按钮。
然后:
- 重命名源列(source property)
- 隐藏源列
- 将翻译结果的新列重命名为原列名
下面视频演示了完整步骤。
关于 CSV 翻译,你需要了解的一切
如何统计需要翻译的字符数?
Datablist 提供了一个很方便的计算工具。用 “Characters Count” 计算即可得到某一列的字符总数。
点击列头,然后选择 “Perform calculation”。
接着选择 “Characters count”。
结果会直接显示在 drawer 里。
说明
计算只会针对当前视图(view)。如果你设置了 filter 或选中了部分行,计算会只作用于这些数据,而不是全量。
各翻译服务怎么收费?
先用上一步的字符数(见这里)来估算翻译成本。
Google Translate 和 Deepl 的价格是:每 1000 字符消耗 35 credits。1 credit = $0.001(充值更多会更便宜)。
所以公式是:
(NumberCharacters/1000)*35 = TotalCreditsCost
然后:
TotalCreditsCost*0.001= TotalCostDollar
例如 300,000 字符:
(300000/1000)*35*0.001 = $10.5
**ChatGPT 的价格是每 1000 字符 1 credit。**同样的计算,300,000 字符就是:
(300000/1000)*1*0.001 = $0.3
也就是用 ChatGPT 便宜 30 多倍(10.5/0.3 = 35)。
为什么用 CSV 做批量翻译?
CSV 是一种用纯文本存储结构化数据的格式。在 CSV 文件中,每一行是一条记录,每条记录由多个字段组成,字段之间用逗号分隔(有时也会用分号 “;” 或制表符)。
CSV 是应用之间迁移数据的常见方式。因为它基于文本文件,导出数据库或表格数据都很方便。虽然任何文本编辑器都能打开 CSV,但想避免修改时出错,你仍然需要一个 CSV editor。
你可以在大多数应用中导出 CSV,选择性翻译某几列,然后把翻译后的 CSV 再导入回原应用。
任何“带文本列的结构化清单”都非常适合用 CSV 表示。
例如:
- 翻译商品目录(title、description 等文本列)
- 用结构化文件翻译博客文章(标题与正文内容)
- 翻译用户评价列表(User Reviews)
免费用户可以翻译多少条?
Datablist 使用 Google Translate API 和 Deepl,它们本身是有成本的。我们当然希望能免费提供更多,但仍需要为免费翻译设置上限。
免费用户每月可免费翻译最多 50 条。升级到 Standard 计划即可无限翻译。
我可以使用自己的 Deepl API key 吗?
如果你已经有 Deepl 账号,可以直接在 Datablist 里使用你的 key。对于 Standard 用户,系统提供了设置自定义 Deepl API Key 的选项。
使用自定义 Deepl API Key 时,这个 action 不会消耗 Datablist credits,而是由 Datablist 代表你调用 Deepl API。
当你有超大数据集需要翻译时,这个方式尤其合适。
人工翻译 vs 机器翻译
机器翻译依靠自动化软件把源语言内容翻到目标语言。最好的机器翻译 provider 会使用 AI 与机器学习来提升质量。
当文本更复杂时,专业译员的优势会非常明显:比如长文本、强上下文依赖、技术词密集或需要更强的表达与本地化。
我更喜欢混合翻译(hybrid translation):先用机器翻译打底,再由人工 review 与改写。这种方式尤其适合网页国际化(internationalization)。
支持哪些语言?
Datablist 的自动翻译依赖 Google Translate API、Deepl API 和 ChatGPT API。Google Translate 支持的语言列表见此页面。写作本文时,共支持 111 种语言,可在这些语言之间互译。
Deepl 支持的语言更少。目前大约支持 28 种语言。


























