ACG日记:AI大模型游戏/小说汉化(翻译)傻瓜教程

承接上个教程(AI大模型即时翻译GALGAME傻瓜教程),可能有朋友觉得哪怕是4080显卡即时翻译速度也不够理想,而且对非GALGAME来说,一次只能翻译一个窗口,也未免过于不方便。因此,这次BLOG主给大家做一个全面、傻瓜的使用AI大模型即时制作汉化补丁的傻瓜教程。另外,如果打不开网站请自己搞把梯子。另外需要注意!所有使用AI翻译的游戏,根据开源公约的要求,禁止以“个人汉化”的名义发布,必须在显眼位置标注为AI翻译作品。另外为帮助实在没有梯子的朋友,BLOG主上传了本教程所需工具,可以点击下载,但仍然强烈建议到github仓库页面下载最新版本。

一、选择大模型

都知道chatgpt强大,但昂贵的价格和极其麻烦的布置(最近连API都锁了区)都让人望而却步。于是经过BLOG主筛选后,决定选择中文中属于第一梯队的“deepseek”开源大模型作为汉化补丁制作的AI大模型。附图为deepseek官网提供的各模型评分。

BLOG主精选了当前所有免费的在线翻译和“deepseek”AI大模型进行对比,选择的原文是一段来自日本维基百科上的日文原文。

高校を卒業した岡崎 朋也と遅れて卒業したヒロイン古河 渚のその後を描いたものである。朋也は卒業後、芳野 祐介の所属している電気工事会社に就職する。渚は病気がちで留年を繰り返しながらも朋也に遅れて1年後に学園卒業を成す。父・直幸の問題により、朋也の会社での出世は果たせなくなるものの、それが朋也と渚が結婚するきっかけとなる。結婚後、渚は岡崎 汐を出産するものの、母親である渚が出産後に死亡する。その後、あまりの虚無感から朋也は育児できず、母方の祖父・祖母である古河 秋生古河 早苗が5年ほど汐の育児をする。その後早苗の計画により、朋也は汐と二人で直幸の故郷へ旅行し、祖母の岡崎 史乃と面会。祖母は直幸の過去を語り、これにより朋也と直幸は和解した。その後、朋也が汐を引き取り育児を始めるも、汐は病気がちとなり、旅行に出かけた冬の日、雪の中で倒れる。その一方で、朋也に関係した人達の問題を解決していき、各ルートを攻略することで得られる「光の玉」を拾っていく事により、終盤の世界が入れ替わるきっかけとなっていく。

除了上述,群里还有小伙伴测试了deepL和彩云,可以认为所有免费的在线翻译全面落后于deepseek的翻译质量。另外,BLOG主也测试过sakuraLLM,使用4080显卡跑满“sakura-13b-lnovel-v0.9b”模型,其整体翻译质量还是不如deepseek。可以认为,除非是选择规模更大或者专业化程度更高的大模型(开源当前没有),仅从质量考虑,deepseek已经是当前一般民用最好的翻译大模型。

而除了质量这个核心要求之外,选择deepseek的另一个原因则是因为:便宜。先不论deepseek注册就送的500万token(有效期一个月),当前deepseek的费用是10元/500万token,实测翻译一个1M文本量左右的GALGAME,花费约1.5元RMB,哪怕是逆天级别的CLANNAD文本量,花费应该在10元左右。考虑到大多数人的游戏/小说需求,可以认为是充10元用一年,而且AI大模型本身API就可以有各种用法,未来BLOG主有机会还可以继续分享一些其他的项目。

确定选择之后,各位可以选择注册一个deepseek账号,注册后会免费赠送500万token(1个月有效)。完成注册后进入后台,点击创建一个新的“API keys”,创建之后将“key”复制保存好。(注意这个KEY只能在创建页面看到一次,如果后来遗忘只能重新创建,无法找回。)

二、导出日语原文

1、Mtool(超简单的提取文本工具)

要对游戏进行汉化,最重要的是“解包”和“封包”。他们分别的意思是将游戏“破解”导出游戏的原文本,以及将翻译好的文本重新打包回游戏中这两个步骤。但是这两个步骤对个人的计算机水平要求比较高,对于一般玩家而言,推荐使用“Mtool”提取游戏文本。

该工具正常使用完全免费,支持“RPG Maker 2k / 2k3 / XP / Vx / VxAce / MV / MZ / Wolf RPG / TyranoBuilder / SRPG Studio / Kirikiri / SMILE GAME BUILDER / Bakin / Ren’Py / Pixel Game Maker MV”等多个游戏引擎的注入,可以提取出基于该引擎的游戏文本。

我们首先下载Mtool本体,解压缩之后运行“点我打开工具.bat”即可打开工具本体。

打开工具后,将游戏的运行程序(exe后续名的文件)拖入mtool中加载运行。稍等片刻游戏即可正常启动。这里还是以blog主之前教程的“妹!せいかつ~ファンタジー~”游戏举例。将游戏的运行程序“GamePro.exe”拖入MTool的窗口中,等待片刻游戏就会自动启动。

载入游戏完成后,我们点开Mtool工具栏上的“翻译”选项卡,等待全部内容加载完成后(通常要几十秒到数分钟不等),我们可以在这个页面上看到待翻译文本总量约“1.07M”,接下来我们点击“导出待翻译的原文”按钮并点确定。

随后我们就会发现游戏文件夹中生成了一份“ManualTransFile.json”的文件。这就是我们需要翻译的游戏脚本文件,我们可以使用任意文本工具打开,就可以看到待翻译文本的内容。

三、辅助翻译工具

最后一步就是对刚刚导出的文件进行翻译了,BLOG主选择的是工具是“AiNiee”。下载并解压缩后,运行程序。然后在“账号设置”-“官方接口”页面中,选择“deepseek-chat”,然后将第一部中获得的api key复制到中间的文本框中。然后点击下面的“测试请求”按钮,确保出现测试成功的绿色提示,然后别忘了按“保存配置”。

然后我们来到“翻译设置”-“基础设置”页面,根据下图进行设置。其中注意新建两个文件夹,一个名字是“input”,专门放刚刚从MTool中导出的待翻译原文件,另一个新建文件夹是“output”,专门放翻译完成后输出的汉化文件。完成设置后,别忘了点击“保存配置”。

然后来到的是“发送设置”页面,按照下图进行设置。其中翻译行数建议最高不要超过80行,否则可能会影响翻译准确性。携带上文行数对MTool导出的文本可能不太有价值(因为Mtool导出的不一定是顺序剧本)。最大线程数建议根据自己电脑CPU实际线程数进行设置,如果不懂就填“0”。

最后,我们再次确认待翻译的“ManualTransFile.json”是不是已经放进了input文件夹中。

确保没有问题后,我们来到“开始翻译”页面,点击下方的“开始翻译”按钮。然后就是静待翻译完成。由于翻译软件本身的问题,建议翻译的时候还是别操作别的东西了,一旦软件卡死就前功尽弃了。另外需要注意软件中显示的“花费tokens”和“花费金额”只是一个估算,跟deepseek中实际产生的费用不一致,因此不用紧张,实际花费要少20%左右。

经过统计本次翻译共计耗时约20分钟(MTool中统计的文本量为1.073MB,json实际大小为1.8MB,这是由于翻译脚本文件是由日语+中文组合而成的,所以会占用更多的空间)。本次翻译实际产生费用为:1.4元。其实“妹!せいかつ~ファンタジー~”这个游戏的文本量在黄油中是非常庞大的了,大多数小黄油的翻译费用甚至不到0.1元,而一个正常规模的GALGAME翻译费用约2-5元,哪怕是规模最大的CLANNAD,整体的翻译费用应该也在10元以内。

等全部翻译完成后,我们可以在output文件夹中找到“ManualTransFile_translated.json”命名的文件,这就是本次翻译好的成品。接下来只需要通过MTool再次加载游戏,并在“翻译”页面点击“加载翻译文件”,选择翻译好的脚本,就可以安心享受完全汉化完毕的游戏了!

四、进阶教程

进阶部分主要分成两个,一个是翻译用的“字典”,另一个则是MTool还没适配的游戏引擎如何提取的问题。这里就不做过多的介绍,仅作为抛砖引玉。

1、字典

如上图,AiNiee内置了非常细致的字典分类,从世界观、人物、特殊词语都做了专门的分类。部分游戏的专有名词比较多,部分人名也喜欢用简称、昵称。也有一些谚语或者俗语大模型可能比较难翻译,这部分内容可以通过提前输入,让大模型在翻译的过程中对这些内容进行准确翻译。具体相关的内容,可以使用KeywordGacha工具,自动提取游戏中的关键词(需要二次确认),或者查询中文网站萌娘百科。日文也可以直接到游戏的官方发布页面去看看。

2、更多的游戏引擎解包

纵然MTool已经覆盖了相当多种的游戏引擎,但也还是存在部分引擎缺失的情况。这时候可以学习使用Translator++来代替MTool进行脚本提取。必须说明的是,不是所有游戏都支持文本提取!如果遇到非常偏门的游戏,就是无法提取文本进行翻译(部分厂就喜欢搞自研引擎或者加一大堆私货),那还是老老实实使用即时翻译吧。

四、总结

终于把这个AI大模型翻译的两篇教程写完了!对于大多数玩家来说,在AI翻译模型的支持下,畅玩90%的GAL真的不再是问题。但作为风铃汉化组的组长,我心里面也是百感交集。当前AI汉化质量,基本上跟一个N2甚至N1的翻译人员水平相当,虽然在纠错能力上还有所欠缺,但是其成本低、速度快的特点,干趴大多数用爱发电的翻译不成问题。或许不久的将来,语言问题不再是阻碍文化之间交流和传播的阻碍,我们也将不再依赖汉化者们日以继夜的努力产出。但也希望大家不要忘记,正是国内无数汉化者们无私的奉献,才让我们度过了黎明前的长夜。

5条评论

留言

您的电子邮箱地址不会被公开。 必填项已用 * 标注