번역 용어집 101 — 기계 번역 전반에서 캐릭터 이름과 용어 고정하기
기계 번역은 고유명사를 평탄화합니다. 번역 용어집은 모든 배치, 모든 제공자에 걸쳐 소스→타깃 용어 쌍을 강제 치환합니다 — 그래서 여주인공의 이름이 1장과 47장에서 똑같이 읽힙니다. RuneTranslate의 플레이스홀더 마스크 작동 방식, TM과 용어집이 함께 작동하는 시점, 그리고 번역가 간에 용어집을 공유하는 CSV 워크플로.
200줄짜리 일본어 비주얼 노벨을 DeepL에 돌리면 여주인공의 이름이 Alice로 나옵니다. 다음 200줄을 돌리면 Aris가 됩니다. 그다음 배치는 Arisu로 정합니다. 4장쯤 되면 어느 장면을 읽느냐에 따라 그녀의 이름이 세 개가 됩니다.
이것이 긴 서사형 게임에서 기계 번역이 가장 흔하게 실패하는 방식입니다 — 나쁜 문법도, 어색한 표현도 아니라, 일관성 없는 고유명사입니다. 제공자는 배치 간에 기억이 없어서, 이름을 볼 때마다 가장 그럴듯한 로마자 표기를 그냥 추측합니다. 40시간짜리 RPG 전체에 걸쳐 이 편차는 읽을 만한 번역을 마치 네 사람이 따로 번역한 것처럼 느껴지게 만듭니다.
번역 용어집이 이를 해결합니다. 소스-대-타깃 용어 쌍을 한 번만 정의하면 — アリス → Alice, 勇者 → Hero, 魔王 → Demon Lord — 모든 제공자의 모든 번역 배치가 이를 따릅니다. 제공자는 그 용어들의 원래 형태를 아예 보지도 못합니다. 이 글은 바로 그것에 관한 것입니다.
용어집이란 실제로 무엇인가
RuneTranslate의 용어집은 3열 규칙 목록입니다:
- source — 고정할 소스 언어 부분 문자열(기본값은 일본어; 지원되는 모든 소스 언어) (예:
勇者) - target — 출력에서 어떻게 표시되기를 원하는지(예:
Hero) - targetLang — 이 규칙이 적용되는 출력 언어(그래서 영어 + 스페인어 + 독일어를 한 번에 아우르는 하나의 용어집을 가질 수 있습니다)
전형적인 비주얼 노벨 등장인물 목록에 이런 규칙 30개를 추가하면 고유명사 편차라는 문제 부류 전체를 단번에 없앨 수 있습니다.
플레이스홀더 마스크 작동 방식 (제공자 무관)
용어집을 강제하는 순진한 방법은 제공자가 실행된 후에 타깃 용어를 끼워 넣는 정규식을 작성하는 것입니다. DeepL에서는 그럭저럭 되지만 LLM 제공자에서는 실패합니다: LLM은 번역한 용어를 중심으로 이미 문장을 재구성했고, 정규식 치환은 매달린 관사와 이상한 대문자 표기를 남깁니다.
RuneTranslate는 용어집 용어가 제공자에 도달하기 전에 마스킹합니다. 러너는 배치된 모든 소스 문자열을 훑으며 모든 용어집 소스를 숫자 플레이스홀더로 — [[G0]], [[G1]] 등 — 교체합니다. 제공자는 오역할 수 없는 불투명한 토큰을 봅니다. 돌아오는 길에 그 플레이스홀더는 여러분의 타깃 용어로 교체되고, 그 위에 엔진 태그 마스크(RPG Maker 코드, KAG 태그, Ren'Py 보간)가 복원됩니다.
결과: 용어집 용어는 DeepL이든, OpenAI GPT-4o든, Anthropic Claude든, 무료 Google Translate든 동일하게 렌더링됩니다. 같은 마스크, 같은 복원 단계, 같은 최종 출력.
우선순위 — TM이 용어집을 이기고 용어집이 제공자를 이긴다
번역 배치가 러너 내부에서 어떻게 처리되는지 알아둘 가치가 있습니다. 왜 용어집 수정이 제공자 크레딧을 소모하지 않는지, 그리고 번역 메모리가 용어집과 어떻게 협력하는지를 설명해 주기 때문입니다:
- 번역 메모리(TM) 단락. 이 정확한 소스 문자열을 과거 어떤 프로젝트에서든 이미 번역했다면, 캐시된 번역이 즉시 제공됩니다 — 제공자 호출 0회, 비용 0. 해당 유닛은 제공자가 보기 전에 배치에서 제거됩니다.
- 용어집 마스크가 TM이 처리하지 않은 유닛에 적용됩니다.
- 제공자 호출은 마스킹된 텍스트에서 일어납니다. 이것이 돈이 들거나 / 할당량에 산정되는 유일한 단계입니다.
- 복원 — 용어집 플레이스홀더가 여러분의 타깃 용어가 되고, 그 위에 엔진 태그가 복원됩니다.
- TM 기록 — 최종 번역된 줄이 캐시되어, 다음번에 이 일본어를 볼 때 1단계로 무료로 돌아갑니다.
TM 히트는 가장 큰 비용 절감이고, 용어집은 가장 큰 품질 절감입니다. 둘은 함께 시너지를 냅니다: 한 줄을 한 번 손으로 수정하면 TM에 캐시되고, 용어집은 캐시 히트에서도 새 배치에서도 고유명사를 일관되게 유지합니다.
TM + 용어집 상호작용 (바이패스 가드)
알아둘 만한 미묘한 예외 상황이 하나 있습니다: 3개월 전에 勇者가 포함된 100줄을 용어집 없이 번역했고, TM이 그것을 Warrior / Champion / Hero로 무작위로 캐시했는데 — 이제 勇者 → Hero를 용어집에 추가하면 어떻게 될까요?
순진하게는, TM이 다음번에 勇者를 볼 때 여전히 Warrior를 돌려줄 것입니다 — 결국 그게 캐시된 것이니까요. RuneTranslate는 이에 대비합니다: TM 히트 시점에, 용어집 소스가 현재 유닛에 나타나는데 캐시된 타깃이 용어집의 타깃 표기를 포함하지 않으면, 그 캐시 히트는 우회되고 해당 유닛은 새 제공자 호출로 넘어갑니다. 실행 종료 요약에 „N개 유닛이 용어집 변경을 반영하기 위해 캐시를 우회함“ 줄이 표시되어 그런 일이 있었음을 알 수 있습니다.
순효과: 오래된 프로젝트에 새 용어집 항목을 추가해도 낡은 번역에 발이 묶이지 않습니다. 영향받은 유닛에 대해 번역 패스를 다시 실행하기만 하면 됩니다.
용어집 구축하기 — 무엇을 추가할까
전형적인 프로젝트라면 영향력 순으로 정렬하세요:
- 등장인물 목록 먼저. 이름 있는 모든 캐릭터. 가능하면 위키 / VNDB / 게임 자체 크레딧 화면에서 가져오세요. 이것만으로 긴 게임에서 편차의 80%가 사라집니다.
- 장소는 두 번째. 마을, 던전, 지역, 왕국. 특히 그럴듯한 로마자 표기가 둘 이상인 한자로 쓰인 것은 무엇이든.
- 대표 공격 / 스킬은 세 번째. 보스 공격 이름, 반복되는 주문 이름, 특수기 이름. RPG와 전투 비중이 큰 VN에 중요합니다.
- 세계관 고유 용어는 네 번째. 게임이 종족 / 클래스 / 유물 / 화폐에 쓰는 창작 단어들.
추가하지 말아야 할 것: 흔한 단어들. 剣 → sword는 오탐의 지름길입니다 — 제공자가 알아서 잘 번역했을 剣이 들어간 모든 합성어(魔剣, 聖剣, 剣士)를 고정하게 됩니다. 용어집 항목은 문자 그대로의 부분 문자열 일치이니, 고정하려는 고유명사에 고유할 만큼 충분히 길게 유지하세요.
CSV 가져오기 / 내보내기 — 용어집 공유
협업자와 함께 팬 번역 프로젝트를 번역하나요? 설정의 용어집 탭에는 CSV 가져오기와 CSV 내보내기 버튼이 있어 여러분의 항목을 RFC-4180 CSV 파일로 왕복시킵니다:
source,target,targetLang
勇者,Hero,en
アリス,Alice,en
魔王,Demon Lord,en
村人A,Villager A,en
勇者,Héroe,es
헤더 행은 필수입니다. 쉼표, 따옴표, 줄바꿈이 포함된 필드는 큰따옴표로 감싸지며, 내장된 따옴표는 ""로 이스케이프됩니다. 가져오기 시 선택적 BOM이 있는 UTF-8(Excel은 기본적으로 UTF-8-BOM으로 내보냅니다). 빈 행과 지원되지 않는 targetLang 코드가 있는 행은 행별 사유와 함께 건너뜁니다.
가져오기는 Merge 모드(CSV 행을 현재 용어집 위에 추가, source+언어로 중복 제거, 충돌 시 CSV 우선)와 Replace 모드(기존 것을 지우고 CSV 내용만 사용)를 제공합니다. Merge는 부분 용어집을 공유하는 협업자에게 알맞은 기본값이고, Replace는 백업 보관 / 복원에 알맞습니다.
현재 제한 사항
- 문자 그대로의 부분 문자열 일치만. 정규식도, 와일드카드도 없습니다.
勇者よ와勇者だ를 모두 고정해야 한다면 지금으로서는 두 항목을 추가합니다. - 타깃 언어별 쌍. 용어집 항목은 하나의 출력 언어에 묶입니다. „source=勇者, targets=Hero (en) + Héroe (es) + Held (de)“를 한 행에 정의할 수 없습니다 — 세 행을 추가합니다. CSV 형식은 이를 자연스럽게 지원합니다.
- Supporter / Pro 등급 전용. 무료 등급은 용어집 카드를 보여주지만 항목이 번역 실행에 영향을 주지 않습니다. 안내 대화상자는 Patreon을 가리킵니다.
마무리
기계 번역의 모든 품질 지렛대 중에서 용어집은 노력 대비 영향의 비율이 가장 높습니다 — 10분 들여 만들면 이후에 일관성 없는 이름을 손으로 고치는 몇 시간을 아낄 수 있습니다. 등장인물 목록부터 시작해 1차 결과물을 내보내고, 결과를 읽으며 편차를 발견할 때마다 용어를 추가하세요.
톤을 잘 다루는 제공자(VN에는 Anthropic Claude가 제 기본값입니다)와 짝지으면, 여러분의 출력물은 이미 „읽을 만한 기계 번역“ 문턱을 넘어 „가벼운 손질만 하면 팬 번역으로 배포할 수 있는“ 영역에 들어섭니다.
실제 프로젝트에서 용어집을 사용해 보려면 RuneTranslate 다운로드. Supporter($3/mo) 기능이며, 무료 등급은 엔진 + 제공자에 대해 완전히 열려 있습니다.
RuneTranslate를 써볼 준비가 되셨나요?
무료 등급에서 모든 엔진과 모든 번역 제공자가 열립니다. Supporter($3/mo)로 최고 속도가 열립니다.
Windows용 다운로드