本文来自微信公众号:果壳 (ID:Guokr42),作者:苏七年,原文标题:《不再是傀儡!ChatGPT或将让游戏角色拥有真正的“灵魂”》,题图来自:《赛博朋克2077》
(资料图)
你玩游戏吗?有没有想过,如果有天游戏里的NPC真的“活了”,会是怎样的?
我很喜欢《星露谷物语》,游玩时间加起来超过一百个小时了。在这款模拟经营游戏里,玩家可以种田、养动物、下矿井,还能跟村民们交流感情乃至结婚,根据自己的喜好自由地经营属于自己的农场与生活。
没有玩过星露谷物语的一生是不完整的(bushi) | Steam
可是,我能根据自己喜好推进这款游戏,游戏中的村民却不行。他们在游戏中的生活是“固定”的、程序事先完全写好的。如果照着攻略,你完全能够知道在某一日的某一时刻某个村民会在某个地方做某件事情。
每个NPC的活动都是严格按照时刻表写好的 | StardewvalleyWiki
与此同时,村民们之间互相都有亲情、友情、爱情上的设定,但实际上除了特殊剧情,平时你很难看到各个NPC之间有什么交流。
换句话说,这些村民们没有“灵魂”,只不过是受程序支配的傀儡而已。
但GPT改变了一切:近日,有研究者使用GPT-3.5-Turbo(是的,甚至没用到最新的GPT-4),构建了一个丰富的沙盒世界。在那个世界里,NPC可开展属于他们自己的生活,出现非事先设定的社交[1]。
一个例子是,举办派对会有NPC准时赴约、也会有NPC放鸽子。角色会做出何种选择并不是程序事先设定好,而是角色自发决定的,这和星露谷物语等传统游戏中的NPC有着本质上的不同。
让NPC真正“活”起来
这篇文章的核心是描述生成式代理人(Generative Agents,以下用GA代替)的程序设计,研究者的目标是,使GA可以根据其过去的经验和环境做出决策,并与其他GA建立关系。
在过去的游戏中,如果游戏开发者想要让游戏中的NPC举办一场派对,那么需要事先写好数十个角色的行为脚本,从时间、地点到行动,工作量巨大。但对GA来说,只要简单告诉目标角色,它想要举办一场派对,那么它就会主动传播这个消息,做好派对准备,然后等候它的朋友们上门一起完成这场派对。
在研发者设计的demo中,一共有25名GA,生活在一个名为Smallville的小镇中,这个小镇设施齐全,每个GA都能在此自由活动。
Smallville和GA在其中的互动[1]
从文章中来看,GA们的互动、玩家能够对这个世界做的干预,都是与以往游戏完全不同的,例如:
GA之间使用自然语言互动,比如用自然语言表达自己对选举活动的看法以及自己对其他GA的好恶,并且从某种意义上来说GA们“理解”了彼此交流的信息,因为这些信息会影响到他们接下来的活动。
(GA互动实例)伊莎贝拉:“我还在权衡我的选择,但我已经和山姆讨论了选举。你对他有什么看法?”汤姆:“说实话,我不喜欢山姆。我认为他与社区很疏离,也不关心我们的最大利益。”
现实生活中的人同样可以用自然语言与GA交流,例如设定自己为新闻记者之类的特殊身份,询问对方对选举的看法,对方就会说出自己的看法。
现实生活中的人还可以用自然语言直接干预GA的行动,例如扮演汤姆的“内心声音”(inner voice),告诉汤姆“你将在即将到来的选举中与山姆竞争”,那么汤姆就会决定和他不喜欢的山姆竞争,并且和他的妻儿分享他的计划。
GA能改变环境对象的状态,比如GA睡觉的时候床就被占用了,GA做完早餐后冰箱就空了。现实生活中的人也可以使用自然语言改变环境对象,并影响到GA的行动。例如将厨房水管设置为“漏水”,GA就会停下手头的活动,在客厅寻找工具进而修补厨房水管。
除此之外,GA还出现了涌现式(Emergent)社交行为。涌现是近年来游戏设计界被广泛讨论的概念,简单来说,就是事先设定好的只有底层规则,然后出现了极其丰富且意外的、复杂度远超底层规则的事件。
对“涌现”一词的理解 | 奶牛关@OCT
对GA来说,涌现式社交活动包括:
信息扩散。GA在进入彼此的注意范围后会简单聊天,他们感兴趣的信息会由此迅速传播。比如山姆要参与竞选这件事一开始只有少数人知道,而通过GA之间的八卦,这件事马上全镇皆知,成为全镇人的谈资。
关系记忆。GA之间的对话会被彼此积累而记住,并且成为下次对话的引子。比如说在第一天的对话中拉托娅跟山姆提到自己正在为报社拍照片,如果第二天再遇到,山姆就询问拉托娅照片拍得怎么样了。
协调活动。GA能够理解指令背后的含义,并且做相关的“现实性准备”。例如,研究人员只有要伊莎贝拉在2月14日下午举办派对的指令,伊莎贝拉会自发做出了传播消息,请好友帮忙装饰场地等社交活动。
其他GA在派对的基础上,同样自发地展开了基于自身设定的社交,例如玛丽亚的角色设定中有暗恋克劳斯这一条,所以在知道派对消息后,她邀请了克劳斯与她一起参加派对,而克劳斯欣然接受了。
派对就像丢进池塘的石子,在小镇上激起阵阵涟漪,你甚至能看出狗血八卦[1]
将虚拟角色变成“人”,分几步?
要让GA的互动如此像真人,研究者面临了相当多的挑战。有意思的是,解决这些问题的方法并不是单纯的技术算法,其中还有很强的模仿人类认知的影子。
例如GA拥有着海量的经历,怎么让GA明白哪些是不重要的,哪些是重要的需要被保留的?如果保留所有的记忆,将会分散GA的“注意力”,降低做出决策的效率,并且从系统运行的角度,也不可能保留所有的行动记录。
技术人员的解决办法就很认知心理学,模拟了人类记忆的编码、储存和提取的过程:
GA经历事件的记忆流记录将会全面保留,与此同时研究者构建了一个检索函数,包含近期度(recency)、重要性(importance)和相关性(relevance)三个变量,分别为最近发生的、重要的和与当前情况相关的事件赋予更高的分数。
GA会筛选出记忆流中最重要的部分,从而做出行动[1]
某种意义上来说,我们的记忆也是如此:最近发生的事更容易回忆起来,重要的事更容易回忆起来,相关的事也更容易回忆起来(比如怎么想也想不到要说什么,冷不丁看到有关联的事物就突然想到了)。
人类的记忆,本来就可以分为长时记忆和工作记忆。长时记忆就像储藏室,堆满了你过往人生的纪念品;工作记忆就像你面前的桌子,摆着你此刻要用的东西。
类似的,你可以把GA包含所有行动的记忆流理解为长时记忆,而提取相关事件,排列优先级的过程理解为工作记忆。这个过程其实就是对人类注意、记忆和决策等认知活动的模拟。
除此之外,研究者还通过一定的机制,让GA产生了反思的能力。GA能够思考自己的行为和选择,按照自己的价值观做出排序。
例如,GA将不再简单地因为表面的状态变量,例如跟谁相处时间更长,而决定谁更重要(因为你可能跟舍友相处的时间更长,但实际上你们只是简单打招呼的关系)。
GA将深入反思自己的设定,例如克劳斯会想“我对研究充满热情”,而“玛丽亚也同样热爱研究”,所以“我们可能会聊得来”,进而认为玛丽亚对自己最重要。
除此之外,GA还有一定的规划计划能力,以及根据环境的不同,展开不同的对话的能力。比如看到一个画家在画架旁和看到一个画家在咖啡馆,GA的对话将会截然不同。
某种程度上,人类的智能可能也是涌现的结果,通过某些简单的底层基础设定,最终发展出了如此复杂的智能。
这种模拟甚至让人开始拥有更大胆的猜想:搞不好,我们这些人根本也不是真的,而是数字模拟人,也就是GA。
这就是牛津大学的哲学家尼克·博斯特罗姆(Nick Bostrom)提出的“模拟论点”(simulation argument)。这个论点基于两个假设:
1. “意识”可以在计算机里被模拟出来。
2. 科技发展到一定地步,可以使用巨大的计算力。
假设几千年后的人类,已经可以在超级计算机上运行上百万个“古人类世界”,每个虚拟的“古人类世界里”都有几百亿个模拟意识。模拟出来的人类意识数量,就会大大超过非模拟的人类意识数量。
那么,作为一个“意识”,我们是模拟意识的概率,也就大大超过是真实意识的概率。
我们可能是我们的曾曾曾曾曾曾曾曾曾曾……孙子孙女玩的游戏里的NPC。
作为普通人,我们可以期待什么?
电子游戏中,NPC的影子无处不在,尤其是强调沉浸感与代入感的角色扮演游戏,玩家与NPC能不能有足够的互动,是营造沙盒世界氛围感的关键。
《赛博朋克2077》为人诟病,是因为NPC极其僵硬且缺少互动,使得游戏中的城市未来味十足,却好像一个空壳;《荒野大镖客》则恰恰相反,靠海量事先设定的台词与行动脚本营造出一个粗粝狂野的西部牛仔世界,广受好评。
荒野大镖客的体验是很流畅自然,让你沉浸进去的 | Bilibili
但就算开发人员花再多的心思,事先写好角色脚本的传统方式总会遇上跨不过去的底层问题,比如脚本终将穷尽,一直与NPC对话,将不可避免地陷入重复中。
店小二永远都在“欢迎客官再来”,村长发布完任务后只会循环复读“抢走粮食的哥布林首领在东边的山上,走过村门口的平原就到了”。
如果你想跟卫兵NPC对话,最后他永远会回到“膝盖中了一箭”上 | 上古卷轴5
而像GA这类基于AI的游戏角色,可能完全改变这种现状,让每个NPC都涌现出完全不一样的行为和对话,即使是一个路人NPC也能有“人味”,让游戏中的城市和人真正活起来。
NPC之间的信息传播,同样是很有开发潜力的点。例如玩家到小山村做任务时,村民们会因为NPC中间的口口相传,听说到玩家的英雄事迹,从而为玩家大开方便之门,这会让玩家非常有代入感。
除了角色扮演类游戏,模拟经营类游戏也将产生极大变化。AI驱动叙事在游戏界并不是第一次出现,《矮人要塞》(Dwarf Fortress)和《环世界》(RimWorld)就是先驱。玩家严格意义上来说并不能直接控制某个角色去做某件事,只能操控营地所需的工作内容和小人的工作优先级等条件,让小人在相处和冲突中生成有趣而惊喜的故事。
如果能结合GA这样的技术,让游戏中的角色有了更丰富的人性,这类故事将带来完全不一样的体验。类GA技术还可能是联结各种游戏类型的桥梁,游戏不再被圈定在某种玩法或类型下,创造出充满可能性的虚拟世界。
另一方面,有些人还开始有了另外的担忧,比如社交媒体上有可能出现与人无异的机器人,让识别人类真实发言的难度大大上升。
“将游戏替换成推特,你就会发现情况很糟糕”,“推特未来将充斥着隐藏在真人档案后的机器人,你将耗费更多精力才能与真人交流” | Twitter
这种设计也可能被用到色情行业,让西部世界中暴露人类恶劣面的乐园成为现实。
风险无疑与收益并存,未来这类技术将会带来什么样的影响,与每个人如何使用技术息息相关。
在文章的最后,我还想说一个小彩蛋。
研究中提到的沙盒游戏Demo被称为Smallville,即Small Village(小村庄)的缩写,亦是一部中文翻译为《超人前传》的美剧。
不知道这个同名是无心的还是研究者有意为之 | 豆瓣
这部剧的剧情简介是这么写的:
1989年10月Smallville发生的一场流星雨,彻底改变了这个平凡小镇的命运。超人降落在这里并由肯特夫妇收养。10多年后,年轻的超人克拉克肯特,在成长过程中,渐渐认识到了自己的宿命。
这仿佛某种隐喻。
站在此刻的时间点往后望,我们几乎可以肯定,以GPT为代表的AI将是一场彻底改变人类命运的流星雨。它可能带来新生,也可能带来毁灭。无论如何,它真的很壮观。
参考文献:[1] https://arxiv.org/pdf/2304.03442.pdf
本文来自微信公众号:果壳 (ID:Guokr42),作者:苏七年
关键词: