翻译日本游戏的最佳翻译服务(2026):DeepL、ChatGPT、Claude 与 Google 对比
对 DeepL、OpenAI GPT-4o、Anthropic Claude 和 Google Translate 翻译日式 RPG 和视觉小说的诚实对比。质量、每百万字符成本,以及何时该用哪个。
为日本游戏挑选翻译服务,坦白说是整个工作流程中最关键的决定。引擎兼容性决定了这款游戏到底能不能被翻译;而翻译服务决定了成品是否易读、是否贴合角色、是否负担得起。这篇文章正是我当初起步时希望能读到的对比:四家服务、真实成本、各自真正擅长什么,以及何时该选哪一家。
这四家服务在 RuneTranslate 中都开箱即用。你可以按项目自由搭配——或者在 Supporter 等级上使用服务路由,把短字符串(物品名、菜单项)发给便宜的服务,把较长的对话发给高端服务。
四家服务,按使用场景排名
1. DeepL——叙事对话的主力
它最擅长的:长篇日语叙事翻译。DeepL 是一套统计/神经机器翻译(MT)系统,专门针对 JA ↔ EN 等少数几个语言对做过调优。它输出的英文流畅、措辞自然,其他 MT 系统始终难以企及。
成本:免费额度每月覆盖 500,000 字符。Pro 为 $7/mo,更高等级为 $25/mo。对于一款典型的 10,000 行 Wolf RPG 游戏(约 150k 字符对话),免费额度绰绰有余。
它的短板:风格化台词、俚语、拟声词、角色语气。DeepL 输出的英文语法完美却平淡——所有角色最终听起来都一个样。它对跨行的上下文也处理得不好。
适合用于:RPG Maker、Ren'Py 动态小说、Wolf RPG,以及任何叙事密集的作品。尤其适合你打算手动润色的初稿。
2. OpenAI GPT-4o (ChatGPT)——具备上下文感知的质量
它最擅长的:具备上下文感知、角色语气一致的翻译。4o 系列能真正从周围的台词判断出这是什么类型的游戏,并据此调整语域——正式的 NPC 对口语化的队友。它对角色风格化台词中的英文俚语处理得很好。
成本(截至 2026):gpt-4o 约为每百万输入 token $2.50、每百万输出 $10。对一款 10,000 行的视觉小说:约 ~$0.30 到 ~$0.80,取决于每行有多长。
它的短板:在长篇批处理中可能不够稳定——同一个角色可能在不同批次之间切换语域。偶尔会加入破坏设定的自由发挥。有时会拒绝成人内容(如果你在翻译 eroge,这是个实实在在的问题)。
适合用于:角色语气鲜明的视觉小说(Kirikiri / TyranoBuilder 的 VN 完美契合),以及语域至关重要的游戏。避免用于纯叙事——你会为用不上的质量付费。
3. Anthropic Claude——eroge / VN 专家
它最擅长的:保留语气、角色语气和拟声词——这三点正是视觉小说的生死攸关之处。相比 GPT,Claude 更愿意翻译风格化台词(俚语、方言日语),而不是把它规范成教科书式英语。在翻译 eroge / doujin 时,它也明显更愿意处理成人内容,不会动辄拒绝或过度净化。
成本:Claude Sonnet 约为每百万输入 token $3、每百万输出 $15——与 GPT-4o 相当。Haiku 4.5 更便宜(约 ~$1/$5),在短字符串上意外地能干。
它的短板:偶尔会对输出过度格式化(加入多余的换行、引号)。在纯对话上,以相近质量而言比 GPT-4o 略贵一些。
适合用于:视觉小说,尤其是成人向的。以及那些你希望译者真正传达角色、而非把所有人的台词都抹平的游戏。
配合 RuneTranslate 的术语表功能(Supporter+),Claude 在长篇 VN 上可以达到接近出版级的质量。术语表会在整批内容送达服务之前,就把每个角色名、地名和招牌招式锁定为特定译法——于是 Claude 的语气保留工作是建立在稳定、一致的术语之上的。那些女主角会随 Claude 当时翻译的场景而随机变成「Alice」/「Aris」/「Arisu」的长篇 VN:这一整类错误就此消失。
4. Google Translate (scrape)——免费的兜底选择
它最擅长的:对短小孤立的字符串又免费又快。物品名、按钮标签、菜单字符串、hai / iie 选项——Google 无需 API 密钥即可瞬间搞定。
成本:$0。RuneTranslate 使用的是公开的翻译端点,而非付费的 Cloud Translation API。无需配置,无需密钥。
它的短板:对话。对于任何带从句的句子,Google 的 JA-EN 都明显逊于 DeepL。它还有个坏毛病:遇到拟声词或哼哈声时会原样返回源文(RuneTranslate 会检测到这一点,并把该单元标记为失败,让你可以换个更聪明的服务重试)。
适合用于:服务路由中的「短字符串通道」。以及那些翻译物品 + 菜单、并不在意对话质量的 RuneTranslate 免费用户。
按游戏类型给出的实用建议
- JRPG(RPG Maker MV / MZ、Wolf RPG):对话用 DeepL,物品名通过服务路由交给免费的 Google。仅在反派的风格化台词上才退而求其次用 Claude。
- 视觉小说(Kirikiri、TyranoBuilder、Ren'Py):预算允许的话,一切都交给 Claude。GPT-4o 紧随其后。如果你反正要手动润色,DeepL 也够用。
- Eroge / 成人向 VN:Claude。GPT 会拒绝部分内容;DeepL 会抹平角色语气;Google 会把俚语毁得一塌糊涂。
- 免费用户,任何类型:第一遍用免费的 Google,然后针对 Google 搞砸的那些对话行,在 DeepL 免费额度(500k 字符/月)上重跑失败的单元。
服务路由让选择不再非此即彼
在 Supporter 和 Pro 等级上,RuneTranslate 的服务路由允许你设定一个长度阈值(默认 12 字符),把所有更短的内容送往便宜的服务,同时让对话留在你的高端服务上。对一款典型的 VN,这能把你的 LLM 账单削减 60–80%,因为大部分单元数量都是短小的物品 / 菜单字符串,而非对话。
这样一来,选择就从「为整款游戏挑一家服务」变成了「为对话挑一家高端服务,其余交给便宜的 MT」。我目前的配置:对话用 Claude Sonnet,路由通道的短字符串用免费的 Google。一款典型视觉小说算下来大约 $1。
质量也关乎手动润色
没有哪家服务能在第一遍就产出可直接发布的译文。RuneTranslate 的编辑器正是为手动修正这一遍而存在:通读整个项目,标出错误的行,重新键入。服务帮你走完 90% 的路;人来补上最后的 10%。
在 Supporter / Pro 等级上,这些手动修改会缓存进翻译记忆库——同一句日语在另一款游戏里会即时、免费地复用你手动修正过的译文。几款游戏下来,这会累积成一份可观的私人游戏专用术语记忆,而这正是机器服务始终会漏掉的。
下载 RuneTranslate,在真实游戏上直接对比这些服务中的任意一家。免费等级支持每一家服务——只是慢一些。
