讲座丨从小说到sora:人类与AI创作相比,孰美?
近日,美国开放人工智能研究中心OpenAI发布首个视频生成模型“Sora”。该模型通过接收文本指令,即可生成60秒的短视频。一年前,这家研究中心发布的AI语言模型ChatGPT,让文本撰写和创作、检查代码程序等工作变得易如反掌。谷歌公司旗下的人工智能模型“巴德”,可以根据输入的多个词语迅速生成短篇小说或诗歌。AI究竟有哪些“本领”?为何每一次迭代升级都能引发全球热议?3月23日,陈楸帆、小白、黄昱宁三位作家来到上海图书馆,就“从小说到sora:我们如何虚构世界”的主题进行对谈。讲座内容已获上海图书馆授权发布。
陈楸帆:在过去的两年中,人工智能技术的飞速发展,尤其是OpenAI推出的ChatGPT模型,不仅在技术上取得了突破,也在文化和艺术创作领域产生了深远的影响。这几年,我也和AI有很多渊源。在日常工作中,我广泛使用AI工具辅助创作,包括文本生成图片和视频的工具,不仅提高了工作效率,也让我深入思考人类与机器在创作上的本质区别和界限。随着AI技术的进步,我们不可避免地面临着工作被机器人取代的可能性,同时在探索的过程中更深刻的理解人与机器的区别,以及人与机器在创作上的界限。我们是否在非常近的未来面临巨大改变?在当下的时代背景,教育的改革、职业选择的指导以及鼓励孩子们进行何种探索,都成为了亟待讨论的重要话题。
今天,我们将围绕“AI在多大程度上能够替代目前的工作”这一问题展开讨论。我先抛出一个问题,你们觉得AI在多大程度上能够替代现在所从事的工作,比如说写作、翻译、出版、编剧等。小白对AI工具的实际操作有着深刻的体会和见解,我们期待他的分享。
AI在多大程度上能够替代人类目前的工作
小白 :我初次接触的生成模型是一个汉化版本的ChatGPT2.5。我曾与该模型合作,尝试利用分层模型进行小说创作。然而,我在实际操作后发现仅依靠该模型完成创作是不现实的。我利用该模型撰写了一篇一两千字的短篇故事,以及一个中篇小说的两个章节。我注意到,模型在控制创作方向上存在不足,它无法理解作者的意图和创作目的,而是随机生成内容。这些先进的模型可能会对写作和创意领域产生重大影响,甚至可能导致该领域的工作被替代。我这样认为并非出于悲观或乐观的态度,而是觉得这是一个值得深思的有趣问题。在我看来,在可预见的未来(比如5年或10年内),我目前所从事的工作有被替代的可能。这是一个值得关注和讨论的趋势。
黄昱宁:相较于楸帆和小白在技术应用上的深入实践,我目前的认识可能还停留在较为传统的阶段。
谈及AI与写作、出版和翻译的关系,我尚未感受到像小白那样强烈的危机感。尽管去年OpenAI连续发布新模型时,整个行业包括写作界确实经历了一段不安的时期,一些业界领袖在各种报告会上提醒大家思考自己的职业未来。在翻译领域,尤其是技术类和法律类文本,AI的替代速度较快,准确率也较高。例如,英、德语等西方语种之间的翻译,现有的翻译软件已经能够做到相当准确的对应。对于只懂英语的人来说,通过Google等平台的翻译服务,已经能够基本理解其他小语种的内容。然而,中文与英语之间的转换仍存在挑战,语料库的不完善可能是一个限制因素。在文学翻译方面,目前我还没有感受到AI能够完全替代人类翻译的可能性,因为文学理解本身就存在诸多歧义,跨语种的转换更是增加了错误和文化障碍的风险。至于在出版领域应用的AI技术,如Kimi等,为人类提供了新的可能性,例如,能够快速为书籍生成摘要,并有潜力减少人力资源的投入。然而,我对于AI技术的具体瓶颈和未来的发展仍持观望态度。原因在于,在我有限的经验中,我发现AI有时候会“胡说八道”,即提供不准确或不相关的信息。这就需要花费同样多的时间核实和校对,以确保内容的准确性。由于AI的输出结果在不同人看来可能截然不同,这使得对机器的信任变得更加困难。在目前阶段,我还没有足够的样本来全面检验AI的可靠性。尽管AI提供了便利,但其准确性和可靠性仍需经过严格的检验。在能够完全信任AI之前,我们必须谨慎对待其输出的结果。
陈楸帆:关于AI模型在处理不同语言时的能力差异,由于像GPT模型的训练语料库中,英文内容占据了绝大多数,而中文等其他语言的内容相对较少,导致在使用过程中,模型在处理“英译中”时可能不如“中译英”准确。这种语言处理能力的不对称性,正是AI技术在多语言环境中需要克服的挑战。
我自己从2017年开始接触AI并尝试构建自己的模型。尽管最初的尝试非常原始和简陋,但在整个过程中,我深刻体会到技术进步的非线性特性。AI的发展不是匀速的,而是在数据量和参数规模达到一定程度时,会出现能力的飞跃,这种现象在业界被称为技能涌现。这意味着AI模型的潜力远超过最初的设计预期,就像孩子天生具备多种潜能,随着成长会展现出不同的技能。我逐渐认识到,尽管AI在处理结构化信息和生成套路性内容方面表现出色,但人类创作中最宝贵的是非理性的、个人化的元素——那些与个人记忆、生活体验紧密相连的直觉、审美和身体感受,是AI所不具备的。
因此,我认为AI能够帮助完成许多任务,特别是需要高效率和模式化生产的工作。然而,对于那些需要深度个性化和创造性的工作,AI目前还无法取代。例如,AI可能无法完全理解和模拟人类的情感复杂性和文学创作的极端瞬间。在这个时代,对于创作者来说,更重要的是向内挖掘,遵循创作规则,而不是简单地模仿套路。
短反馈文化易扼杀创作想象力
小白:陈楸帆提出的问题涉及到了AI技术发展的根本性问题。随着算力的增强、服务集群的扩大以及算法的优化,AI模型能够处理的数据量呈指数级增长,从而涌现出超出设计预期的能力。这一点在模型的发展中已经得到了验证。
然而,在这一逻辑基础中,我始终怀有一个疑问。因特网最初的底层逻辑源自控制论,其核心目标在于实现控制。因此,人们致力于构建一种能够实现快速反馈的短反馈机制。然而,随着因特网的发展,这种短反馈机制在某个特定阶段发生转变。这一转变是由于美国一些大学和研究机构的科学家们倡导网络无政府主义的理念,将因特网塑造成一个自由开放的空间,但其底层逻辑本质上仍是为了控制人类行为。最终,因特网演变成了众多大型平台,这些平台如今构成了因特网的主体。
这些大型平台积累了大量的数据资源。这些数据量如此之大,以至于有一种说法:仅仅通过在微信上点赞三次,就能够勾勒出一个人的性格画像。更何况,用户每天在这些平台上所有的浏览行为、在电影院的表情动作、在街上的体感互动等,都成为了可收集的数据。现在,技术已经发展到可以感知人的心跳、捕捉所有生理和行为数据,包括基因数据等。面对如此庞大的数据量,传统的数据处理方法显得无能为力。其复杂性和数量级使得个人或传统方法难以有效分析和利用数据。
然而,正是在这种背景下,数据分析和算法优化的发展催生了一系列衍生技术和模型。本质上是为了更有效地处理和分析海量数据。在这一过程中,人们发现,通过优化算法,不仅可以处理数据,还能生成智能。因此,当我们谈论人工智能能够替代人类执行某些任务时,其背后的原因不仅是技术的进步,更是因为现有的数据量和复杂性的要求。这种替代性并非偶然,而是数据处理需求和算法优化发展的必然结果。通常认为,在写作过程中,我们所依赖的是个人独特的经历和情感。然而,目前麻省理工学院(MIT)正在进行一项研究,随机选取大量参与实验的阅读者,在他们的大脑上连接电极,详细记录参与者在接触到不同句子和情感表达时的大脑反应,收集了大量相关数据。这项研究暗示了一个可能的未来,即在文学创作中能够触动人心、引发情感共鸣的元素,有可能通过算法实现。换言之,我们曾认为是人类独有的、充满乐观主义的创作特质,未来或许能够通过技术手段得以复制和再现。
不得不提及,根据最新研究,叙事的概念可能早在尼安德特人时期就已存在。如果将时间线缩短,从现代人出现或者从新石器时代算起,一直到大约16世纪,人类的叙事趋势主要是面对面的交流,具有即时的反馈特性。在这样的反馈机制中,文学作品的形成有其特殊性。例如,荷马史诗是口头文学的代表。从中国古典文学名著《水浒传》《三国演义》等成书过程,到欧洲中世纪的传说故事,所有的叙事文学都是在短反馈的互动中形成的。说书人在表演时,会根据观众的反应即兴创作,如添加人物动作等新元素,观众的即时反馈正是即兴创作的基石。然而,在16世纪,人类的虚构能力经历了一次大爆发。印刷术发明后的结果便是剧场反馈机制消失了。随着文学创作形式的转变,作者开始在单一的环境中创作,完成作品后交由出版商印刷发行,因此读者的反馈变得间接和不确定。这种创作方式使得作者的创作越发天马行空。
创作者的自我成就了当下现代艺术、现代小说的发展,文学流派和形式越发丰富。而一旦进入大模型算法,情况又当如何?随着技术的发展,在可见的未来,大众的所有数据都将被收集和分析,创作者能够获得即时且短距离的反馈,从而准确预测受众的反应。在这种情况下,创作者将根据数据的指引决定创作内容,因为算法的本质在于处理和吸收大量的数据,从而提炼有用的信息和模式。这种基于数据驱动的创作模式,意味着创作者将不再需要天马行空地自由想象。
在这种创作模式下,实际上我们面临着一种转变。过去,作家们拥有无限的创作空间,能够开拓新的文学领域,自由地塑造独特的风格和世界观。世界文学的版图随着新作品的诞生而不断扩展。作家们可以尽情发挥想象力,创作出深奥难懂如《尤利西斯》的作品,尽管可能挑战读者的理解,但它们仍然成为世界文学版图上的重要标记。
然而,一旦某种机制形成,文学的疆域似乎被固定在一张既定的地图上。作家们的创作似乎必须遵循某种既定的规则和模式,不再敢于突破边界;观众也可能不再期待或欣赏那些超越常规的作品。在当下时代,创作者在创作时往往需要考虑来自不同社交平台的反馈,这些评论对创作者产生了显著影响,限制了他们的创造力。一旦创作内容偏离了受众的预期或偏好,可能会遭到批评,认为作品质量不佳。这种现象导致了一种短反馈机制的形成,创作者能够迅速获得受众的反应,并据此调整作品。甚至为了抓住更广泛的下沉市场,选择制作那些能够吸引大量观众的内容。
在短反馈机制的影响下,创作者可能会创作那些更为安全、更有可能获得市场认可的作品,避免冒险尝试那些富有创造力但可能失败的创作。观众也可能缺乏耐心培养感知能力,以深入理解和欣赏需要多花时间体会的作品。他们可能更倾向于快速作出评价,如简单地评0分或1分。这种短反馈文化可能导致创作环境的退化,回到叙事艺术发展缓慢的时期。这时,真正具有创新性和影响力的作品将寥寥无几,文学和艺术的多样性和丰富性可能受到限制。
黄昱宁:在讨论关于人工智能与创作的问题时,我同意小白的许多观点,尽管我们在某些细节上,特别是关于未来展望的乐观或悲观程度上有所不同。我个人认为,这既包含好消息也包含坏消息。好消息是,我相对乐观地认为,在可预见的未来,人工智能无法达到与人类相同的感受能力。原因在于,AI缺乏实体身体,没有疼痛感,不会经历诸多情感体验。文学的本质与生命的有限性紧密相连。一个知晓自己终将死亡的人所创作的作品,与一个不知道自己会死亡的工具所创作的作品,是截然不同的。人类的真实感受和即时性体验仍然非常宝贵,难以被机器人完全复制。然而,我也有一个与小白相似的坏消息。在市场的压力下,出版商可能会倾向于利用数据分析和AI技术来预测和创造畅销作品。这种趋势可能会影响文学作品的多样性和原创性,导致市场上充斥着相似的作品,缺乏真正的创新和深度。
如果没有读者对新事物的渴望和需求,作者也就缺乏创造新内容的动力。反之,如果读者仅仅满足于重复旧有的套路,作者也就难以产生创作新作品的动机。维持作者与读者之间健康的关系,鼓励创新和多样性,对于文学的繁荣至关重要。
短视频无处不在,难以抵挡。一旦观众观看一个视频多于一秒钟,算法就会记录下来,并迅速推送更多类似的内容。不断的强化过程导致这些内容内化为个人的需求,这种短反馈机制使得信息茧房现象愈发严重。茧房越来越小,越来越紧密,而人们却感到满足,因为时间被利用,日子似乎过得也不错。更令人担忧的是,信息茧房提供的都是个人偏好的内容,使人误以为自己的观点和兴趣是普遍的,情绪价值很快就得到满足,当然对新的创意新的套路失去兴趣,而这些一定会马上反馈给创造者。
《尤利西斯》在这个时代出现,光看文本就会被枪毙?
黄昱宁:阿尔法狗(AlphaGo)在围棋领域战胜人类顶尖选手的事件,无疑是人工智能发展史上的一个里程碑。这一成就不仅展示了人工智能在特定领域超越人类智力的可能性,也引发了广泛的思考和讨论。由此,我想到了一个有趣的假设:如果机器人与人类在写小说这一领域进行比较,将会是怎样的情形?
在创作一部小说时,我最初设想了一个有趣的设定:一场小说家、真人和机器人之间的写作比赛。但随着写作的深入,我意识到关键不在于谁写得更好,而在于读者如何评判这些作品。因此,小说的焦点转向了作者与读者之间的关系。我在《文学病人》中探讨了这种关系。小说的结尾设定了一个荒诞的情景:机器人和读者被放在一个岛上,机器人通过比赛来激发真人作者和读者的新灵感,目的是希望人类能创作出新颖的内容,因为如果人类创作停滞不前,机器人也无法获得新的创意。这是一个隐喻,我想借此传达一个信息:如果我们继续重复旧有的创作模式,连机器人都会感到厌倦。
陈楸帆:最近,日本芥川文学奖获奖作品就是通过人与AI的共创完成,这种合作方式在文学界已经逐渐被接受。这显示了AI在文学创作中的潜力,同时也提出了一个问题:在AI和人类创作的界限越来越模糊的今天,如何定义文学的价值和美的标准?随着AI的高效率创作,它可能会迅速占据所有的平台和时间,影响受众的审美和选择。科学实验也表明,人类的自由意志可能比想象中更容易被操控。
在这样的背景下,科幻小说创作变得更加困难,现实生活本身已经充满了科幻元素。面对这样的挑战,我们如何创作现实主义作品和科幻小说,如何虚构当下世界?是否有办法逃脱被算法和外部影响控制的宿命?这可能无解,因为即使人类认为自己在自由选择,实际上可能已经被无形的力量左右。在现如今,写作不仅是艺术创作,也是对自由意志和人性的深刻探索。
小白:我前两天提到,我们应该在“(写作)地图”被完全划定之前尽量拓展创作的疆域。趁着现在不用担心豆瓣、短视频等平台对作品的评价,应该大胆地发挥创造力,不受限制地去写作。这样能够在失去自我之前,尽可能地扩大自己的创作空间。
陈楸帆:这样会很容易失控。
黄昱宁:对,要扩大创作的范围,首先得有足够的经济基础。现实中,我们受到很多条件的限制,比如出版社的规定和市场的需求。作为编辑,我们不能随意决定翻译和出版的内容。我们每天都在开会讨论各种选题,分析读者可能喜欢的内容。虽然我们的分析能力不如计算机,但我们还是努力地去理解市场和读者的喜好。这往往意味着我们需要做一些妥协,去适应市场的需求。
陈楸帆:如果《尤利西斯》在这个时代出现,你们会出版吗?
黄昱宁:不可能,如果光看到文本绝对枪毙……这里面包含很多附加条件,比如作者乔伊斯在创作《尤利西斯》时已属于知名作家,而非无名小卒。
陈楸帆:当初是因为他在巴黎。
小白 :有一群文人控制了一大批同人的杂志。
陈楸帆:这是一个权力结构。
黄昱宁:都柏林作为一个文学中心已经建立了声誉。当时的文学思潮也需要这样的地方进一步发展。从商业角度来看,都柏林提供了可能性它能够影响读者,让读者逐渐相信这是他们自己所追求的。媒体和影响力集团就像磁场作用于读者,塑造他们的阅读喜好和需求。
小白:那时候的资本市场是一个“看不见的手”。
黄昱宁:一切都更直接。
小白:在过去,资本市场的特点在于敢于冒险,但现在的资本市场已经不同了,当我知道你们喜欢什么,为什么还要冒险呢?专注于头部项目不是更好吗?为什么还要尝试那些不确定的事物呢?整个体制结构已经发生了变化。这种变化在大型平台出现后逐渐加剧。所有算法本质上都是从平台产生的,平台收集数据,然后利用这些数据创建算法和模型。这就是底层逻辑的发展过程。
陈楸帆:这是平台资本主义可能导致的局面。我认为,这对于新兴作者和年轻作者而言特别不利。我帮助过很多从未正式发表过作品的年轻作者向杂志投稿,反馈通常是,即使新人写得再好,要让读者和市场接受和认识他们,也需要投入更多的资源。这意味着投入的认知成本更高,很多机构可能不愿意付出额外努力。结果就是,马太效应越来越明显,资源和注意力越来越集中在头部作品上,内容变得同质化,新人越来越难以崭露头角,整个生态系统逐渐变得不健康。
黄昱宁:即使新人作者有机会崭露头角,他们的成功往往也是基于平台算法的套路和预测。新人作者并非没有机会成功。现在的读者越来越倾向于将文本与作者本人等同起来,不太愿意承认作者的虚构能力。他们更倾向于认为文学作品是作者自述的体现,认为作品中的一切都是作者的真实写照。这种趋势甚至在一些平台上变得理所当然。最终作品成为文本和作者形象捆绑在一起的商品。很多新作家就是通过这样的方式出现。
人类与AI的关系应当成为共生体
陈楸帆:有一种观点认为,任何职业的发展可以分为三个阶段:首先是作为一份职业(Career),然后是成为专业人士(Professional),在这个层次上,你已经具备了一定的专业水平,成为某个领域的专家。最后是达到传奇(Legendary)的境界,这时你不仅在专业上有所成就,还要将自己塑造成一个故事、品牌,甚至成为一种可以自我销售的商品。在AI时代,这种将自己变成故事和品牌的能力可能是不容易被AI取代的,因为它涉及到个人独特的经历、情感和创造力。这种能力要求创作者在自我表达和市场定位之间找到平衡,创造出既真实又具有吸引力的个人形象。戏如人生、人生如戏的状态就是分不清哪部分是真的,哪部分是假的,哪部分是虚构的,哪部分是非虚构的,我觉得当下时代非常具有挑战性。
黄昱宁:太悲观了。
陈楸帆:在文化产业领域,我们需要保持乐观,积极畅想光明的未来。AI可以被视为一面镜子,反映人类的优势和不足。当看到AI创作的内容时,我们会被激励创作更独特、更出人意料的作品。AI时代的关键是要成为工具的主人,发挥人类的主观能动性与AI互动。如果使用得当,AI可以提升人类的创造力、效率和自我认知。人类与AI的关系可能成为共生体,信息在彼此之间流动,我们输入信息给AI,AI再回馈信息。如果能形成正向的反馈循环,人类的能力将不断提升。反之,如果我们使用AI时懒惰、被动、消极,它也可能会削弱我们的主观能动性。人类已经生活在“人机共生”的时代,很难抵抗这种趋势。
小白:保持乐观很重要。我自己也一直在使用AI工具,发现确实非常有用。比如前两年,我需要为一个学术报告会准备一些理论性较强的书评,大约要在10天内完成3篇。那时,我利用AI工具整理和提炼信息,效果非常好。虽然所有的思路和结构都是我自己的,但AI帮助处理了大量资料,我只需要几天时间就完成了通常需要更久的工作,效率很高。从个人角度来看,社会结构的重大变化就像一场牌局结束后的洗牌。我们可以将这种变化视为一个新开始,一个重新布局的机会。关键在于个人如何看待这一时刻、如何抓住机会。所以,我们可以乐观地看待这种变化,就像重新发牌一样,每个人都有机会重新规划和构建自己的未来。这种乐观的态度有助于我们积极面对变化,寻找新的可能性和机遇。(校对:陈梦霏、李菁)