Glosario de traducción 101 — fijar nombres de personajes y terminología en la traducción automática
La traducción automática aplana los nombres propios. Un glosario de traducción fuerza la sustitución de pares de términos origen→destino en cada lote, en cada proveedor — para que el nombre de tu heroína se lea igual en el capítulo 1 y en el capítulo 47. Cómo funciona la máscara de marcadores de RuneTranslate, cuándo la TM y el glosario trabajan juntos, y el flujo de trabajo con CSV para compartir glosarios entre traductores.
Pasa una novela visual japonesa de 200 líneas por DeepL y el nombre de la heroína sale como Alice. Pasa las siguientes 200 líneas y es Aris. El siguiente lote se decide por Arisu. Para el capítulo cuatro tiene tres nombres según la escena que leas.
Este es el modo de fallo más común de la traducción automática en juegos narrativos largos — no la mala gramática, ni las frases torpes, sino los nombres propios inconsistentes. El proveedor no tiene memoria entre lotes; simplemente adivina la romanización más plausible cada vez que ve un nombre. A lo largo de un RPG de 40 horas, esa deriva convierte una traducción legible en algo que parece traducido por cuatro personas distintas.
Un glosario de traducción soluciona esto. Defines los pares de términos origen-destino una sola vez — アリス → Alice, 勇者 → Hero, 魔王 → Demon Lord — y cada lote de traducción, en cada proveedor, los respeta. El proveedor ni siquiera llega a ver esos términos en su forma original. De eso trata esta publicación.
Qué es realmente un glosario
Un glosario en RuneTranslate es una lista de reglas de tres columnas:
- source — la subcadena en el idioma de origen que se quiere fijar (japonés por defecto; cualquier idioma de origen compatible) (p. ej.
勇者) - target — cómo quieres que se represente en la salida (p. ej.
Hero) - targetLang — a qué idioma de salida se aplica esta regla (para que puedas tener un solo glosario que cubra inglés + español + alemán a la vez)
Añade 30 de estas para el reparto típico de una novela visual y habrás eliminado de un solo golpe toda esa categoría de deriva de nombres propios.
Cómo funciona la máscara de marcadores (independiente del proveedor)
La forma ingenua de aplicar un glosario es escribir una expresión regular que sustituya el término de destino después de que se ejecute el proveedor. Eso funciona más o menos con DeepL, pero falla con los proveedores LLM: el LLM ya ha reformulado la frase en torno al término que tradujo, y tu sustitución con regex deja artículos colgando y mayúsculas raras.
RuneTranslate enmascara los términos del glosario antes de que lleguen al proveedor. El runner recorre cada cadena de origen del lote y reemplaza cada source del glosario por un marcador numérico — [[G0]], [[G1]], etc. El proveedor ve tokens opacos que no puede traducir mal. De vuelta, esos marcadores se reemplazan por tu término target, y luego se restaura encima la máscara de etiquetas del motor (códigos de RPG Maker, etiquetas KAG, interpolaciones de Ren'Py).
El resultado: los términos del glosario se representan de forma idéntica tanto si usas DeepL, OpenAI GPT-4o, Anthropic Claude o el Google Translate gratuito. Las mismas máscaras, el mismo paso de restauración, la misma salida final.
Orden de prioridad — la TM gana al glosario, que gana al proveedor
Vale la pena saber cómo se procesa un lote de traducción dentro del runner, porque explica por qué las ediciones del glosario no te cuestan créditos de proveedor y cómo la memoria de traducción coopera con el glosario:
- Cortocircuito de la memoria de traducción (TM). Si ya has traducido exactamente esta cadena de origen en cualquier proyecto anterior, la traducción en caché se sirve al instante — cero llamadas al proveedor, cero coste. La unidad se elimina del lote antes de que el proveedor la vea.
- Se aplica la máscara del glosario a las unidades que la TM no haya servido.
- La llamada al proveedor ocurre sobre el texto enmascarado. Este es el único paso que cuesta dinero / consume cuota.
- Restauración — los marcadores del glosario se convierten en tus términos de destino, y luego se restauran encima las etiquetas del motor.
- Escritura en la TM — la línea traducida final se guarda en caché para que la próxima vez que veas este japonés vuelva al paso 1 gratis.
Los aciertos de TM son el mayor ahorro de coste. El glosario es el mayor ahorro de calidad. Juntos se potencian: edita una línea a mano una vez, se guarda en la TM, y el glosario mantiene los nombres propios consistentes tanto en los aciertos de caché COMO en los lotes nuevos.
Interacción entre TM y glosario (el guardián de omisión)
Hay un caso límite sutil que conviene conocer: ¿qué pasa si tradujiste hace tres meses 100 líneas que contenían 勇者 sin glosario, la TM las guardó en caché como Warrior / Champion / Hero al azar — y ahora añades 勇者 → Hero al glosario?
Ingenuamente, la TM seguiría devolviéndote Warrior la próxima vez que veas 勇者 — al fin y al cabo, es lo que quedó en caché. RuneTranslate protege contra esto: en el momento del acierto de TM, si un source del glosario aparece en la unidad actual Y el destino en caché no contiene la representación de destino del glosario, el acierto de caché se omite y esa unidad pasa a una nueva llamada al proveedor. El resumen de fin de ejecución mostrará una línea «N unidades omitieron la caché para respetar cambios del glosario» para que sepas que ocurrió.
Efecto neto: añadir una nueva entrada al glosario de un proyecto antiguo no te deja atascado con traducciones obsoletas. Basta con volver a ejecutar la pasada de traducción sobre las unidades afectadas.
Construir tu glosario — qué añadir
Para un proyecto típico, ordena por impacto:
- El reparto primero. Cada personaje con nombre. Sácalo de una wiki / VNDB / la propia pantalla de créditos del juego si puedes. Esto por sí solo elimina el 80% de la deriva en juegos largos.
- Los lugares después. Pueblos, mazmorras, regiones, reinos. Sobre todo cualquier cosa escrita con kanji que tenga más de una romanización plausible.
- Los ataques / habilidades característicos en tercer lugar. Nombres de ataques de jefes, nombres de hechizos recurrentes, nombres de movimientos especiales. Importante para RPGs y VNs con mucho combate.
- La terminología propia del mundo en cuarto lugar. Palabras inventadas que el juego usa para razas / clases / artefactos / moneda.
Qué no añadir: palabras comunes. 剣 → sword es una receta para los falsos positivos — fijarías cada compuesto que contenga 剣 (魔剣, 聖剣, 剣士) que el proveedor habría representado bien por su cuenta. Las entradas del glosario son coincidencias literales de subcadena; hazlas lo bastante largas como para ser únicas del nombre propio que intentas fijar.
Importar / exportar CSV — compartir glosarios
¿Traduces un proyecto de traducción fan con colaboradores? La pestaña de glosario en Ajustes tiene botones de Importar CSV y Exportar CSV que hacen un viaje de ida y vuelta de tus entradas a través de un archivo CSV RFC-4180:
source,target,targetLang 勇者,Hero,en アリス,Alice,en 魔王,Demon Lord,en 村人A,Villager A,en 勇者,Héroe,es
La fila de encabezado es obligatoria. Los campos que contienen comas, comillas o saltos de línea se envuelven en comillas dobles; las comillas incrustadas se escapan como "". UTF-8 con BOM opcional al importar (Excel exporta UTF-8-BOM por defecto). Las filas vacías y las filas con códigos de targetLang no compatibles se omiten con un motivo por fila.
La importación ofrece un modo Fusionar (añade las filas del CSV encima de tu glosario actual, elimina duplicados por source+idioma, el CSV gana en caso de conflicto) o un modo Reemplazar (borra lo existente y usa solo lo que hay en el CSV). Fusionar es la opción correcta por defecto para colaboradores que comparten un glosario parcial; Reemplazar es la adecuada para archivar / restaurar copias de seguridad.
Limitaciones actuales
- Solo coincidencias literales de subcadena. Sin regex, sin comodines. Si necesitas fijar tanto
勇者よcomo勇者だ, de momento añades dos entradas. - Pares por idioma de destino. Una entrada del glosario está ligada a un solo idioma de salida. No puedes definir «source=勇者, targets=Hero (en) + Héroe (es) + Held (de)» en una sola fila — añades tres filas. El formato CSV admite esto de forma natural.
- Solo nivel Supporter / Pro. El nivel gratuito muestra la tarjeta del glosario pero las entradas no afectan a las ejecuciones de traducción. El cuadro de diálogo de descubrimiento apunta a Patreon.
Para terminar
De todas las palancas de calidad en la traducción automática, el glosario tiene la mayor relación entre esfuerzo e impacto — diez minutos construyéndolo te ahorran horas de arreglar a mano nombres inconsistentes más adelante. Empieza por el reparto, publica una primera pasada y añade términos a medida que lees el resultado y notas deriva.
Combínalo con un proveedor que maneje bien el tono (Anthropic Claude es mi opción por defecto para VNs) y tu salida ya habrá superado el umbral de la «traducción automática legible» y entrado en el territorio de «podría publicarse como traducción fan con una ligera edición a mano».
Descarga RuneTranslate para probar el glosario en un proyecto real. Es una función de Supporter ($3/mo); el nivel gratuito sigue totalmente desbloqueado para motores + proveedores.
¿Listo para probar RuneTranslate?
El plan gratuito desbloquea todos los motores y todos los proveedores de traducción. Supporter ($3/mo) desbloquea la velocidad completa.
Descargar para Windows