用户登录投稿

中国作家协会主管

重视聊天机器人背后的语言知识与伦理
来源:光明日报 | 饶高琦  2022年12月14日10:25

最近一段时间,人工智能和互联网领域最火的话题莫过于智能对话系统“生成式预训练模型聊天机器人”(ChatGPT,暂译,以下简称“聊天系统”)。该系统不仅支持包括中文在内的多语聊天,而且还能够扮演角色,甚至执行编程。对于或诙谐或严肃的提问,它的表现令人感到惊艳:相当多的知识内容正确,语言表达更是流畅,并且还支持多轮连续聊天。因此,不少人感慨“自己已经沉迷于和它对话”“让它替我编程、写稿,效率提升”,甚至有人用它生成了某行业的咨询报告,通过对话引导它生成的书也在亚马逊线上出版。但在聊天系统流畅交谈的表面下,其对人类知识的掌握仍不可靠。随着测试的增加,也有越来越多的人感慨它“常常一本正经地胡说八道”。错误信息以纯熟的语言表达出来,因而更加隐蔽。但无论如何,在不少人认定本轮人工智能泡沫开始破碎的时间点,它的诞生无疑是给人们打了一剂“强心针”。

人工智能所涉任务众多,语言智能却越来越成为方法、技术、应用方面的领先领域。正如聊天系统对自己的介绍:“我是一个语言模型。”该系统得以驾驭极其广泛的知识内容,来自对互联网文本内容的获取和“理解”,进而形成了自己的“知识体系”。其中所涉技术十分复杂,但它的成功无疑以十分直观的方式向我们展示了语言之于人类知识乃至人类思维的重要性。人工智能的核心在于知识的获取、表示和运用,语言无疑是其中关键。教科书上“语言是人类最重要的思维工具”“人类九成的知识由语言承载”的论断在人工智能系统的应用上得到了淋漓尽致的展现。知识和思维的承载物是语言,因而也赋予语言无可替代的资源属性。智能技术的发展和落地,频繁向传统语言学的教育和研究发出信号:构建语言资源、挖掘语言中的知识、探索语言知识的形式表达,是最切中数字社会命脉的发展方向。

当然,正如过去几十年中任何一项智能技术的成熟落地一样,聊天系统也引起了一波“失业潮”的舆论。这样的担心实不必要。过去几十年里,智能技术成熟引起的“失业潮”几乎从未出现,短期内或许会搅动局部行业,但长期来看却相反。技术应用本身也催生了大量新岗位,例如聊天系统的研制本身依赖于海量的人工数据标注和反馈,数据标注师和测试员岗位需求巨大。

更深层次来看,与聊天系统强大的语言生成能力不匹配的是它对知识的真正掌握程度。大量模棱两可乃至错误的信息混杂在流畅的对话中,反而令其更加难以被发现。诚如清华大学马少平教授所说:“人工智能最大的问题是不知道自己不知道什么,也不知道自己真知道什么,什么问题都能回答,结果如何就不得而知了。”在一般性知识极易获取,复杂知识参差不齐的背景下,人类专家的专业判断力和经过思考加工的准确回答,更显弥足珍贵。人工智能诸多技术“黑箱”带来的不确定性,终究还需要人类专业、全局判断来化解。从这个层面上讲,“自知”的人类永远不可或缺。

也恰恰因为技术“黑箱”的存在,人类才需要不断从自身、从技术去寻求可靠、可信的技术和技术使用方式。可信的人工智能、可信计算成为融合技术、伦理的重要领域,并受到越来越多的重视。更宏观的人工智能伦理和治理工作也早已被纳入科技管理的视野。挽救“失足系统”,矫正“智能体歧视”也许不再是比喻,而将成为使用者、从业者和治理者都必须面对的问题。

(作者:饶高琦,系北京语言大学汉语国际教育研究院助理研究员)