速度千倍、自动识别、风格呈现…… AI翻译助力网文出海
来源:中国文化报 | 周志军 2019年12月31日08:34
随着中国网文出海迅速发展,作品的翻译质量和规模也逐渐成为各方关注的焦点。近年来,国内网文企业纷纷加强与人工智能科技企业的合作,共同探索网文作品的相关翻译工作。
近日,30部由人工智能(AI)翻译的中国网文作品上线起点国际平台,该平台新推出的“用户修订翻译”功能也同步上线。新功能令用户在阅读过程中能够对AI翻译进行即时编辑修正,修订信息还能够使翻译模型的效果得到不断优化。
近年来,中国网文出海规模逐渐扩大,海外读者对作品的数量和翻译质量需求也逐渐增加,这对国内网文企业提出了更高的要求。阅文集团联席CEO吴文辉介绍,作为国内较成熟的网文出海平台,目前,阅文集团旗下起点国际已与世界各地的200余名译者和翻译组保持着长期的合作关系,并建立了译者招募培训体系、翻译质量把关体系、核心标准词库等,持续对国内经典优质网文作品进行翻译输出,在全球积累了大批忠实读者。但目前,由于国内网文作品数量规模巨大,人工翻译出海的头部作品只是海量网文作品中的一小部分,这还不包括不断涌现的新人新作。
为了让全球“催更”读者更快、更全面地感受中国网络文学的魅力,满足全球读者不断增长的阅读需求,网文企业与人工智能科技企业在AI翻译模型开发方面进行了大量探索。据了解,此次在起点国际上线的30部AI翻译的中国网文作品,就是由阅文集团与国内人工智能公司彩云科技共同开发的AI翻译模型完成的。
“该模型能够针对普通难度的网文文本进行翻译,翻译速度是人工翻译的千倍,大大释放了海量网文作品的长尾价值。同时,为了更好地把控文本翻译质量,我们还对AI翻译模型进行了集中性的‘专项训练’,既往优秀的译本、经典网文原作、标准核心词库都是AI学习、训练的语料。”彩云科技有关负责人说,在针对网文的AI翻译模型开发过程中,开发团队基于自然语言理解技术,还加强了对内容的深入挖掘,“比如通过对大量网文内容和优质社区内容的清洗、训练和标注,使得AI机器能够更好地理解网文内容,以此建立网文平台的‘内容大脑’。基于‘内容大脑’,AI可以提取网文的一些专有名词,同时可以自动识别角色(人名)、场景(地名)、升级体系等结构化信息,构建整体网文的知识图谱。”而有了这些信息的补充,AI翻译就能够更好地翻译网文特殊领域中的词、句、段落,包括作品中的人名、地名以及类似“金丹”这种网文作品中的专有名词,并识别出各种代词指代的对象,尽可能避免传统机器翻译时常常出现的“一词多译”“张冠李戴”等现象。
此外,开发团队在训练AI模型时还加入了“翻译风格”的选项,方便对不同品类网文作品的风格进行精准呈现。比如,针对不同的风格要求,AI能够将同一句话用多种不同的译法进行差异化呈现。
据了解,目前,我国网文出海范围已覆盖英语、西班牙语、日语、韩语、泰语、越南语、印度尼西亚语等10余个语种(包括自有平台运营和海外授权合作)。作为在海外率先实行付费阅读的中国正版网络文学平台,起点国际在谷歌应用程序商店的营收榜单上,长期位列图书分类的头部,累计访问用户已超过5000万。平台上有600余部中国网文英文翻译作品,包括武侠、玄幻、奇幻、都市等多元题材。这些作品既蕴含着传统东方元素,又展现出当代中国风貌,同时含有人类共通的情感和故事元素,在海外读者中均有很高的人气。
“这些走出去的原创网文作品是中国网文作为‘文化旅者’漂洋过海、在全世界开出的‘中国花’。来自美国、英国、菲律宾、印度等地的数万海外读者,在起点国际的平台上从读者甚至慢慢转变为作者。一个基于中国文化的国际化粉丝社区正在逐步建立,在这个社区体系下,海外用户可以通过多元互动模式,以及平台上的特色词汇百科等,深度了解中国以及中国的网文作品。”吴文辉说。
此外,在海外授权方面,我国目前也已向全球多个国家的合作方进行了数字出版、实体出版以及IP改编授权等,授权作品近800部。其中改编自《从前有座灵剑山》《全职高手》等网络小说的动漫、图书已登陆日本等国家;《庆余年》《皇权》等已授权出版泰文版;《鬼吹灯》系列的英文版图书已由企鹅兰登书屋出版;女频类高人气作品《许你万丈光芒好》已向越南授权影视改编。
除了文字,我国网络文学还通过影视、动漫、游戏等多种方式在海外“圈粉”。比如,在海外热播的影视剧《全职高手》《扶摇》《你和我的倾城时光》《琅琊榜》等,都是由知名网文IP改编而成。
业内人士认为,基于网络文学和相关产业在海外的发展热度,未来,我国网文企业将持续加码海外市场。而网文企业与人工智能科技企业在作品翻译上的合作探索,也将进一步助力我国网文出海进程。