Übersetzungsglossar 101 — Charakternamen und Terminologie über maschinelle Übersetzungen hinweg festlegen
Maschinelle Übersetzung verflacht Eigennamen. Ein Übersetzungsglossar erzwingt Quell→Ziel-Begriffspaare über jeden Batch, jeden Anbieter — sodass der Name deiner Heldin in Kapitel 1 genauso gelesen wird wie in Kapitel 47. Wie RuneTranslates Platzhalter-Maske funktioniert, wann TM und Glossar zusammenarbeiten und der CSV-Workflow zum Teilen von Glossaren zwischen Übersetzern.
Jag eine japanische Visual Novel mit 200 Zeilen durch DeepL und der Name der Heldin kommt als Alice heraus. Lass die nächsten 200 Zeilen laufen und es ist Aris. Der nächste Batch entscheidet sich für Arisu. In Kapitel vier hat sie drei Namen, je nachdem, welche Szene du gerade liest.
Das ist der mit Abstand häufigste Fehlermodus maschineller Übersetzung bei langen Erzählspielen — keine schlechte Grammatik, keine holprige Formulierung, sondern inkonsistente Eigennamen. Der Anbieter hat kein Gedächtnis zwischen den Batches; er rät jedes Mal, wenn er einen Namen sieht, einfach die plausibelste Romanisierung. Über ein 40-Stunden-RPG hinweg verwandelt dieser Drift eine lesbare Übersetzung in etwas, das sich anfühlt, als hätten vier verschiedene Leute daran gearbeitet.
Ein Übersetzungsglossar behebt das. Du definierst die Quell-zu-Ziel-Begriffspaare einmal — アリス → Alice, 勇者 → Hero, 魔王 → Demon Lord — und jeder Übersetzungsbatch bei jedem Anbieter respektiert sie. Der Anbieter bekommt diese Begriffe nie in ihrer Rohform zu sehen. Genau darum geht es in diesem Beitrag.
Was ein Glossar eigentlich ist
Ein Glossar in RuneTranslate ist eine Liste dreispaltiger Regeln:
- source — der zu sperrende Teilstring in der Quellsprache (standardmäßig Japanisch; jede unterstützte Quellsprache) (z. B.
勇者) - target — wie es in der Ausgabe erscheinen soll (z. B.
Hero) - targetLang — für welche Ausgabesprache diese Regel gilt (so kannst du ein einziges Glossar haben, das Englisch + Spanisch + Deutsch auf einmal abdeckt)
Füge 30 davon für die typische Besetzungsliste einer Visual Novel hinzu, und du hast die gesamte Klasse des Eigennamen-Drifts in einem Rutsch beseitigt.
Wie die Platzhalter-Maske funktioniert (anbieterunabhängig)
Der naive Weg, ein Glossar durchzusetzen, ist, ein Regex zu schreiben, das den Zielbegriff nachdem der Anbieter gelaufen ist einsetzt. Bei DeepL funktioniert das halbwegs, bei LLM-Anbietern scheitert es: Das LLM hat den Satz rund um den übersetzten Begriff bereits umformuliert, und dein Regex-Austausch hinterlässt baumelnde Artikel und seltsame Großschreibung.
RuneTranslate maskiert Glossarbegriffe, bevor sie den Anbieter erreichen. Der Runner geht jeden gebündelten Quelltext durch und ersetzt jede Glossarquelle durch einen numerischen Platzhalter — [[G0]], [[G1]] usw. Der Anbieter sieht undurchsichtige Tokens, die er nicht falsch übersetzen kann. Auf dem Rückweg werden diese Platzhalter durch deinen Zielbegriff ersetzt, und darüber wird dann die Engine-Tag-Maske (RPG Maker-Codes, KAG-Tags, Ren'Py-Interpolationen) wiederhergestellt.
Das Ergebnis: Glossarbegriffe werden identisch dargestellt, egal ob du DeepL, OpenAI GPT-4o, Anthropic Claude oder das kostenlose Google Translate verwendest. Gleiche Masken, gleicher Wiederherstellungsschritt, gleiche endgültige Ausgabe.
Prioritätsreihenfolge — TM schlägt Glossar schlägt Anbieter
Es lohnt sich zu wissen, wie ein Übersetzungsbatch im Runner verarbeitet wird, denn das erklärt, warum Glossaränderungen dich keine Anbieter-Credits kosten und wie das Translation Memory mit dem Glossar zusammenarbeitet:
- Translation-Memory-(TM-)Kurzschluss. Wenn du diesen exakten Quelltext in irgendeinem früheren Projekt bereits übersetzt hast, wird die zwischengespeicherte Übersetzung sofort ausgeliefert — null Anbieteraufrufe, null Kosten. Die Einheit wird aus dem Batch entfernt, bevor der Anbieter sie sieht.
- Glossar-Maske wird auf alle Einheiten angewendet, die nicht vom TM bedient wurden.
- Anbieteraufruf erfolgt auf dem maskierten Text. Das ist der einzige Schritt, der Geld kostet / auf das Kontingent angerechnet wird.
- Wiederherstellung — Glossar-Platzhalter werden zu deinen Zielbegriffen, dann werden darüber die Engine-Tags wiederhergestellt.
- TM-Schreiben — die endgültig übersetzte Zeile wird zwischengespeichert, sodass sie beim nächsten Mal, wenn du dieses Japanisch siehst, kostenlos zu Schritt 1 zurückkehrt.
TM-Treffer sind der größte Kostensparer. Das Glossar ist der größte Qualitätssparer. Zusammen verstärken sie sich: Bearbeite eine Zeile einmal von Hand, sie wird im TM zwischengespeichert, und das Glossar hält Eigennamen konsistent — sowohl über Cache-Treffer als auch über frische Batches hinweg.
TM + Glossar im Zusammenspiel (die Bypass-Absicherung)
Es gibt einen subtilen Grenzfall, den man kennen sollte: Was, wenn du vor drei Monaten 100 Zeilen mit 勇者 ohne Glossar übersetzt hast, das TM sie zufällig als Warrior / Champion / Hero zwischengespeichert hat — und du jetzt 勇者 → Hero zum Glossar hinzufügst?
Naiv betrachtet würde das TM beim nächsten Mal, wenn du 勇者 siehst, immer noch Warrior zurückgeben — schließlich wurde genau das zwischengespeichert. RuneTranslate sichert dagegen ab: Wenn zum Zeitpunkt eines TM-Treffers eine Glossarquelle in der aktuellen Einheit vorkommt UND das zwischengespeicherte Ziel die Zielschreibweise des Glossars nicht enthält, wird der Cache-Treffer umgangen und diese Einheit fällt auf einen frischen Anbieteraufruf durch. Die Zusammenfassung am Ende des Laufs zeigt eine Zeile „N Einheiten haben den Cache umgangen, um Glossaränderungen zu berücksichtigen“, damit du weißt, dass es passiert ist.
Nettoeffekt: Einen neuen Glossareintrag zu einem alten Projekt hinzuzufügen, lässt dich nicht mit veralteten Übersetzungen zurück. Führe einfach den Übersetzungsdurchlauf für die betroffenen Einheiten erneut aus.
Dein Glossar aufbauen — was hineingehört
Für ein typisches Projekt nach Wirkung sortieren:
- Zuerst die Besetzungsliste. Jede benannte Figur. Zieh sie aus einem Wiki / VNDB / dem Abspann des Spiels, wenn möglich. Allein das beseitigt 80 % des Drifts bei langen Spielen.
- Orte als Zweites. Städte, Dungeons, Regionen, Königreiche. Besonders alles, was mit Kanji geschrieben ist, das mehr als eine plausible Romanisierung hat.
- Signature-Attacken / Fähigkeiten als Drittes. Namen von Bossangriffen, wiederkehrende Zaubernamen, Namen von Spezialangriffen. Wichtig für RPGs und kampflastige VNs.
- Weltspezifische Terminologie als Viertes. Erfundene Wörter, die das Spiel für Rassen / Klassen / Artefakte / Währung verwendet.
Was man nicht hinzufügen sollte: gewöhnliche Wörter. 剣 → sword ist ein Rezept für Fehltreffer — du sperrst jedes Kompositum, das 剣 enthält (魔剣, 聖剣, 剣士), das der Anbieter von allein einwandfrei übersetzt hätte. Glossareinträge sind wörtliche Teilstring-Übereinstimmungen; halte sie lang genug, um für den Eigennamen, den du sperren willst, eindeutig zu sein.
CSV-Import / -Export — Glossare teilen
Übersetzt du ein Fan-Übersetzungsprojekt mit Mitwirkenden? Der Glossar-Tab in den Einstellungen hat die Schaltflächen CSV importieren und CSV exportieren, die deine Einträge durch eine RFC-4180-CSV-Datei hin und zurück befördern:
source,target,targetLang
勇者,Hero,en
アリス,Alice,en
魔王,Demon Lord,en
村人A,Villager A,en
勇者,Héroe,es
Die Kopfzeile ist erforderlich. Felder, die Kommas, Anführungszeichen oder Zeilenumbrüche enthalten, werden in doppelte Anführungszeichen gesetzt; eingebettete Anführungszeichen werden als "" escaped. UTF-8 mit optionalem BOM beim Import (Excel exportiert standardmäßig UTF-8-BOM). Leere Zeilen und Zeilen mit nicht unterstützten targetLang-Codes werden mit einer zeilenweisen Begründung übersprungen.
Der Import bietet einen Merge-Modus (die CSV-Zeilen zusätzlich zu deinem aktuellen Glossar hinzufügen, nach source+Sprache deduplizieren, bei Konflikten gewinnt die CSV) oder einen Replace-Modus (Vorhandenes löschen und nur das aus der CSV verwenden). Merge ist die richtige Standardeinstellung für Mitwirkende, die ein partielles Glossar teilen; Replace ist richtig zum Archivieren / Wiederherstellen von Backups.
Aktuelle Einschränkungen
- Nur wörtliche Teilstring-Übereinstimmungen. Kein Regex, keine Platzhalter. Wenn du sowohl
勇者よals auch勇者だsperren musst, fügst du vorerst zwei Einträge hinzu. - Paare pro Zielsprache. Ein Glossareintrag ist an eine Ausgabesprache gebunden. Du kannst nicht „source=勇者, targets=Hero (en) + Héroe (es) + Held (de)“ in einer einzigen Zeile definieren — du fügst drei Zeilen hinzu. Das CSV-Format unterstützt das ganz natürlich.
- Nur Supporter- / Pro-Stufe. Die kostenlose Stufe zeigt die Glossarkarte, aber die Einträge wirken sich nicht auf Übersetzungsläufe aus. Der Hinweis-Dialog verweist auf Patreon.
Zum Abschluss
Von allen Qualitätshebeln der maschinellen Übersetzung hat das Glossar das höchste Verhältnis von Aufwand zu Wirkung — zehn Minuten Aufbau ersparen dir stundenlanges Nachbessern inkonsistenter Namen weiter unten. Beginne mit der Besetzungsliste, liefere einen ersten Durchlauf und füge Begriffe hinzu, während du das Ergebnis durchliest und Drift bemerkst.
Kombiniere es mit einem Anbieter, der mit Ton gut umgeht (Anthropic Claude ist meine Standardwahl für VNs) und deine Ausgabe liegt bereits jenseits der Schwelle „lesbare maschinelle Übersetzung“ und im Bereich „könnte mit leichter Handarbeit als Fan-Übersetzung veröffentlicht werden“.
RuneTranslate herunterladen, um das Glossar an einem echten Projekt auszuprobieren. Es ist eine Supporter-Funktion ($3/mo); die kostenlose Stufe bleibt für Engines + Anbieter vollständig freigeschaltet.
Bereit, RuneTranslate auszuprobieren?
Der Free-Tarif schaltet jede Engine + jeden Übersetzungsanbieter frei. Supporter ($3/Mon.) schaltet volle Geschwindigkeit frei.
Für Windows herunterladen