Glosarium terjemahan 101 — mengunci nama karakter dan terminologi di seluruh mesin penerjemah
Mesin penerjemah meratakan kata benda diri. Glosarium terjemahan memaksakan pasangan istilah sumber→target di setiap batch, setiap penyedia — sehingga nama heroine-mu terbaca sama di bab 1 dan bab 47. Cara kerja masker placeholder RuneTranslate, kapan TM dan glosarium bekerja sama, serta alur kerja CSV untuk berbagi glosarium antar-penerjemah.
Jalankan visual novel Jepang berisi 200 baris melalui DeepL dan nama sang heroine keluar sebagai Alice. Jalankan 200 baris berikutnya dan menjadi Aris. Batch berikutnya memutuskan Arisu. Pada bab empat dia punya tiga nama tergantung adegan mana yang kamu baca.
Ini adalah mode kegagalan paling umum dari mesin penerjemah pada game naratif panjang — bukan tata bahasa yang buruk, bukan frasa yang canggung, melainkan kata benda diri yang tidak konsisten. Penyedia tidak punya memori antar-batch; ia hanya menebak Romanisasi yang paling masuk akal setiap kali melihat sebuah nama. Sepanjang RPG 40 jam, penyimpangan itu mengubah terjemahan yang mudah dibaca menjadi sesuatu yang terasa seperti dikerjakan empat orang berbeda.
Glosarium terjemahan memperbaiki ini. Kamu mendefinisikan pasangan istilah sumber-ke-target sekali saja — アリス → Alice, 勇者 → Hero, 魔王 → Demon Lord — dan setiap batch terjemahan, di setiap penyedia, mematuhinya. Penyedia bahkan tidak pernah melihat istilah-istilah itu dalam bentuk mentahnya. Itulah yang dibahas dalam artikel ini.
Apa itu glosarium sebenarnya
Glosarium di RuneTranslate adalah daftar aturan tiga kolom:
- source — substring bahasa sumber yang dikunci (Jepang secara default; bahasa sumber apa pun yang didukung) (mis.
勇者) - target — bagaimana kamu ingin istilah itu ditampilkan di keluaran (mis.
Hero) - targetLang — bahasa keluaran mana yang berlaku untuk aturan ini (sehingga kamu bisa punya satu glosarium yang mencakup Inggris + Spanyol + Jerman sekaligus)
Tambahkan 30 aturan seperti ini untuk daftar pemeran visual novel pada umumnya dan kamu telah menghapus seluruh kelas penyimpangan kata benda diri dalam sekali langkah.
Cara kerja masker placeholder (bebas-penyedia)
Cara naif untuk menerapkan glosarium adalah menulis regex yang menukar istilah target setelah penyedia berjalan. Itu lumayan berfungsi di DeepL tetapi gagal di penyedia LLM: LLM sudah menyusun ulang kalimat di sekitar istilah yang diterjemahkannya, dan penukaran regex-mu meninggalkan artikel yang menggantung dan kapitalisasi yang aneh.
RuneTranslate menyamarkan istilah glosarium sebelum mencapai penyedia. Runner menelusuri setiap string sumber yang di-batch dan mengganti setiap sumber glosarium dengan placeholder numerik — [[G0]], [[G1]], dan seterusnya. Penyedia melihat token buram yang tidak bisa salah diterjemahkan. Dalam perjalanan kembali, placeholder itu diganti dengan istilah target-mu, lalu masker tag engine (kode RPG Maker, tag KAG, interpolasi Ren'Py) dipulihkan di atasnya.
Hasilnya: istilah glosarium ditampilkan identik entah kamu memakai DeepL, OpenAI GPT-4o, Anthropic Claude, atau Google Translate gratis. Masker sama, langkah pemulihan sama, keluaran akhir sama.
Urutan prioritas — TM mengalahkan glosarium mengalahkan penyedia
Ada baiknya mengetahui bagaimana sebuah batch terjemahan diproses di dalam runner, karena itu menjelaskan mengapa penyuntingan glosarium tidak menghabiskan kredit penyedia dan bagaimana translation memory bekerja sama dengan glosarium:
- Hubung-singkat translation memory (TM). Jika kamu sudah menerjemahkan string sumber persis ini di proyek mana pun sebelumnya, terjemahan yang di-cache disajikan seketika — nol panggilan penyedia, nol biaya. Unit itu dikeluarkan dari batch sebelum penyedia melihatnya.
- Masker glosarium diterapkan pada unit apa pun yang tidak disajikan oleh TM.
- Panggilan penyedia terjadi pada teks yang sudah disamarkan. Ini satu-satunya langkah yang memakan biaya / dihitung terhadap kuota.
- Pemulihan — placeholder glosarium menjadi istilah target-mu, lalu tag engine dipulihkan di atasnya.
- Penulisan TM — baris terjemahan akhir di-cache sehingga lain kali kamu melihat bahasa Jepang ini, ia kembali ke langkah 1 secara gratis.
Hit TM adalah penghemat biaya terbesar. Glosarium adalah penghemat kualitas terbesar. Bersama-sama keduanya saling menguatkan: sunting satu baris dengan tangan sekali, ia di-cache di TM, dan glosarium menjaga kata benda diri tetap konsisten baik di hit cache MAUPUN batch baru.
Interaksi TM + glosarium (penjaga bypass)
Ada satu kasus tepi yang halus dan patut diketahui: bagaimana jika kamu menerjemahkan 100 baris yang mengandung 勇者 tiga bulan lalu tanpa glosarium, TM meng-cache-nya sebagai Warrior / Champion / Hero secara acak — dan sekarang kamu menambahkan 勇者 → Hero ke glosarium?
Secara naif, TM akan tetap mengembalikan Warrior lain kali kamu melihat 勇者 — lagi pula itulah yang di-cache. RuneTranslate menjaga terhadap ini: saat hit TM, jika sebuah sumber glosarium muncul di unit saat ini DAN target yang di-cache tidak mengandung penulisan target glosarium, hit cache itu dilewati dan unit tersebut jatuh ke panggilan penyedia baru. Ringkasan akhir proses akan menampilkan baris „N unit melewati cache untuk mematuhi perubahan glosarium“ sehingga kamu tahu itu terjadi.
Efek bersih: menambahkan entri glosarium baru ke proyek lama tidak membuatmu terjebak dengan terjemahan usang. Cukup jalankan ulang proses terjemahan pada unit yang terpengaruh.
Membangun glosarium-mu — apa yang harus ditambahkan
Untuk proyek pada umumnya, urutkan berdasarkan dampak:
- Daftar pemeran dulu. Setiap karakter bernama. Ambil dari wiki / VNDB / layar kredit game itu sendiri jika bisa. Ini saja menghapus 80% penyimpangan pada game panjang.
- Tempat kedua. Kota, dungeon, wilayah, kerajaan. Terutama apa pun yang ditulis dengan kanji yang punya lebih dari satu Romanisasi yang masuk akal.
- Serangan / skill khas ketiga. Nama serangan bos, nama mantra berulang, nama jurus spesial. Penting untuk RPG dan VN yang penuh pertarungan.
- Terminologi khusus dunia keempat. Kata rekaan yang dipakai game untuk ras / kelas / artefak / mata uang.
Yang tidak boleh ditambahkan: kata-kata umum. 剣 → sword adalah resep untuk positif palsu — kamu akan mengunci setiap kata majemuk yang mengandung 剣 (魔剣, 聖剣, 剣士) yang sebenarnya akan diterjemahkan dengan baik oleh penyedia sendiri. Entri glosarium adalah pencocokan substring harfiah; buat cukup panjang agar unik bagi kata benda diri yang ingin kamu kunci.
Impor / ekspor CSV — berbagi glosarium
Menerjemahkan proyek fan-translation bersama kolaborator? Tab glosarium di Pengaturan punya tombol Impor CSV dan Ekspor CSV yang membolak-balikkan entri-mu melalui berkas CSV RFC-4180:
source,target,targetLang
勇者,Hero,en
アリス,Alice,en
魔王,Demon Lord,en
村人A,Villager A,en
勇者,Héroe,es
Baris header wajib ada. Bidang yang mengandung koma, tanda kutip, atau baris baru dibungkus tanda kutip ganda; tanda kutip yang tertanam di-escape sebagai "". UTF-8 dengan BOM opsional saat impor (Excel mengekspor UTF-8-BOM secara default). Baris kosong dan baris dengan kode targetLang yang tidak didukung dilewati dengan alasan per-baris.
Impor menawarkan mode Merge (menambahkan baris CSV di atas glosarium-mu saat ini, deduplikasi berdasarkan source+bahasa, CSV menang saat konflik) atau mode Replace (menghapus yang ada dan hanya memakai isi CSV). Merge adalah default yang tepat untuk kolaborator yang berbagi glosarium parsial; Replace tepat untuk mengarsipkan / memulihkan cadangan.
Keterbatasan saat ini
- Hanya pencocokan substring harfiah. Tanpa regex, tanpa wildcard. Jika kamu perlu mengunci
勇者よdan勇者だ, untuk saat ini kamu menambahkan dua entri. - Pasangan per-bahasa-target. Satu entri glosarium terikat pada satu bahasa keluaran. Kamu tidak bisa mendefinisikan „source=勇者, targets=Hero (en) + Héroe (es) + Held (de)“ dalam satu baris — kamu menambahkan tiga baris. Format CSV mendukung ini secara alami.
- Hanya tier Supporter / Pro. Tier gratis menampilkan kartu glosarium tetapi entri-nya tidak memengaruhi proses terjemahan. Dialog penemuan mengarah ke Patreon.
Penutup
Dari semua tuas kualitas dalam mesin penerjemah, glosarium punya rasio usaha-terhadap-dampak tertinggi — sepuluh menit membangunnya menghemat berjam-jam perbaikan manual nama yang tidak konsisten di kemudian hari. Mulailah dengan daftar pemeran, kirim satu proses awal, dan tambahkan istilah saat kamu membaca hasilnya dan menyadari adanya penyimpangan.
Pasangkan dengan penyedia yang menangani nada dengan baik (Anthropic Claude adalah pilihan default-ku untuk VN) dan keluaranmu sudah melewati ambang „mesin penerjemah yang mudah dibaca“ dan masuk ke wilayah „bisa dirilis sebagai fan translation dengan sedikit penyuntingan tangan“.
Unduh RuneTranslate untuk mencoba glosarium pada proyek nyata. Ini fitur Supporter ($3/mo); tier gratis tetap sepenuhnya terbuka untuk engine + penyedia.
Siap mencoba RuneTranslate?
Tier gratis membuka setiap engine + setiap penyedia terjemahan. Supporter ($3/mo) membuka kecepatan penuh.
Unduh untuk Windows