使用 AI 能力分析 小说、游戏、字幕 等文本内容并生成术语表的次世代翻译辅助工具
- KeywordGacha,简称 KG,使用 AI 技术来自动生成
实体词语表
的次世代工具 实体词语表
可以在一定程度上解决在长篇文本翻译过程中人名
等实体词语翻译版本不统一的问题- 根据
中、英、日、韩
文本内容自动生成实体词语表
,并且自动翻译
、自动总结
、自动分析
- 相较传统工具,具有高命中、语义化、智能总结角色信息等特色,对文本的兼容性更好
- 极大的提升
小说
、漫画
、字幕
、游戏文本
等内容译前准备时制作词语表的工作效率 - 随机选取 绿站榜单作品 作为测试样本,与人工校对制作的词表对比,命中率约为
80%-90%
- 如您在翻译过程中使用了 KeywordGacha,请在作品信息或发布页面的显要位置进行说明!
- 如您的项目涉及任何商业行为或者商业收益,在使用 KeywordGacha 前,请先与作者联系以获得授权!
- 兼容
OpenAI
标准的 AI 大模型接口 - 兼容 LinguaGacha
使用 AI 能力一键翻译小说、游戏、字幕的次世代文本翻译器
👈👈 - 注意,
SakuraLLM
系列模型只具有翻译功能,无法进行文本分析,不能与KG
配合使用
- 从 发布页 或 百度网盘 下载应用
- 打开配置文件
config.json
,填入 API 信息,建议选择其一: - 双击
app.exe
启动应用,处理流程结束后,结果会保存在output
文件夹内 - 其中:
*_日志.txt
- 抓取到的词语的原文、参考文本、翻译建议、角色信息总结等详细信息,用于人工确认*_列表.json
- 通用词表,可以导入 LinguaGacha 译前替换 等处使用*_术语表.json
- LinguaGacha 术语表 功能专用词语表*_galtransl.json
- GalTransl GPT 字典 功能专用词语表
- 遵循 常见问题 里的建议以获得最佳的使用效果
- 在任务开始时,
KG
将读取指定的文件或文件夹(及其子目录)内所有支持的文件,包括但是不限于:- 字幕(.srt .ass)
- 电子书(.txt .epub)
- Markdown(.md)
- RenPy 导出游戏文本(.rpy)
- MTool 导出游戏文本(.json)
- SExtractor 导出游戏文本(.txt .json .xlsx)
- VNTextPatch 导出游戏文本(.json)
- Translator++ 项目文件(.trans)
- Translator++ 导出游戏文本(.xlsx)
- 当应用目录下有
input
文件夹时,将自动识别input
文件夹内的文件 - 更多格式将持续添加,你也可以在 ISSUES 中提出你的需求
-
20250318 v0.13.1
- 新增 - Translator++ 项目文件(.trans)
- 调整 - 伪名还原执行的时机
- 调整 - 迁移 LLM 设置到独立文件
-
20250301 v0.13.0
- 调整 - 词义分析流程
- 尝试修复非人实体被误判为角色的问题
- 调整 - 词义分析流程
{
"api_key": [
"no_key_required",
"接口密钥,从接口平台方获取,使用在线接口时一定要设置正确。"
],
"base_url": [
"http://localhost:8080/v1",
"请求地址,从接口平台方获取,使用在线接口时一定要设置正确。"
],
"model_name": [
"no_name_required",
"模型名称,从接口平台方获取,使用在线接口时一定要设置正确。"
],
"count_threshold": [
2,
"出现次数阈值,出现次数低于此值的词语会被过滤掉以节约时间。"
],
"request_timeout": [
180,
"网络请求超时时间,如果频繁出现 timeout 字样的网络错误,可以调大这个值。"
],
"request_frequency_threshold": [
3,
"网络请求频率阈值,单位为 次/秒,值可以小于 1,如果频繁出现 429 代码的网络错误,可以调小这个值。",
"使用 llama.cpp 运行的本地模型时,将根据 llama.cpp 的配置调整自动设置,无需手动调整这个值。",
"使用 火山引擎 等不限制并发数的在线接口时可以调大这个值。"
],
"context_translate_mode": [
2,
"是否翻译参考文本,0 - 不翻译,1 - 全部翻译,2 - 只翻译角色实体"
]
}
-
分析
小说文本
的最佳实践- 提前移除
作者评论
、出版社信息
等与故事内容无关的文本 - 目前模型能处理的单行最大长度约为
500
字,过长的句子会被截断,超长单行文本请提前手动分行
- 提前移除
-
处理
游戏文本
的最佳实践- 使用 Translator++ 保存项目为
.trans
格式 - 对于
RPGMaker MV/MZ
游戏- 复制
Actors.json
到指定位置以启用 角色代码还原 功能
- 复制
- 如果抓取效果不好,可以多试几种导出工具和导出格式,有时候会有奇效
- 使用 Translator++ 保存项目为
- 添加 对
英文内容
的支持 - 添加 对
中文内容
的支持 - 添加 对
韩文内容
的支持 - 添加 对
俄文内容
的支持
- 运行时的日志保存在程序目录下的
*.log
等日志文件内 - 反馈问题的时候请附上这些日志文件
- 你也可以来群组讨论与反馈
- QQ - 41763231⑥
- Discord - https://discord.gg/pyMRBGse75