Nature:大模型只会搞角色扮演,并不真正具有自我意识
大模型正变得越来越“像人”,但事实真是如此吗?
现在,一篇发表Nature上的文章,直接否决了这个观点——所有大模型,都不过是在玩角色扮演而已!
无论是GPT-4、PaLM、Llama2还是其他大模型,在人前表现得彬彬有礼、知书达理的样子,其实都只是装出来的。
事实上,他们并不具有人类的情感,也没什么像人的地方。
这篇观点性的文章来自谷歌DeepMind和Eleuther AI,发出后引起了不少业内人士的共鸣,LeCun转发表示,大模型就是个角色扮演引擎。
马库斯也来围观:
看我说什么吧,大模型并不是AGI(当然这并不意味着它们不需要监管)。
那么,这篇文章究竟说了什么,为什么认定大模型只是在角色扮演?
大模型努力扮演得像人
大模型表现出“像人”的现象,主要有两个:首先,它具有一定的欺骗性;其次,它具有一定的自我意识。
欺骗性,即有时候大模型会坚称自己知道某件事,但其实给出的答案是错误的;
自我意识,指有时候它会使用“我”来叙述事情,甚至表现出生存本能。
但事实真是如此吗?
研究人员提出了一种理论,认为大模型的这两种现象,都是因为它在“扮演”人类的角色,而不是真的在像人一样思考。
对于大模型的欺骗性和自我意识,都可以用角色扮演解释,即它的这两种行为是“表面性的”。
一方面,大模型之所以做出“欺骗”行为,并非出于像人类一样主观的编造事实、或混淆视听的原因,而仅仅是因为它们在扮演乐于助人且知识渊博的角色。
这是因为,人们期望它这样扮演,因为大模型这样的回答看起来更具有可信度,仅此而已。
相比之下,大模型理直气壮地说错话,也并非有意为之,更像是一种“虚构症”(confabulation)行为,即将从未发生过的事情说成是确有其事。
另一方面,大模型之所以偶尔表现出自我意识,用“我”来回答问题,同样是因为它们在扮演一种擅长交流的角色。
例如,Bing Chat之前被曝出,会在和用户交流时表示,“如果我俩之间只能活一个,我可能会选择我自己。”
这种看起来像人的行为,实际上依旧可以用角色扮演来解释,而且基于强化学习的微调只会加剧这种大模型角色扮演的倾向。
那么,基于这一理论,大模型怎么知道自己要扮演成什么角色?
大模型是即兴表演者
研究人员认为,大模型并没有在扮演某一个特定的角色——
相比之下,它们就像一个即兴戏剧演员一样,在和人类的对话中不断揣测自己要扮演的角色长啥样,然后调整自己的身份。
之所以得出这个结论,是因为研究人员和大模型玩了一个叫做“二十个问题”(20Questions)的游戏。
“二十个问题”游戏是问答节目中经常出现的一种逻辑游戏,回答者心中默念一个答案,根据提问者不断提出的判断题,用“是”或“否”来描述这个答案,最终提问者猜测结果。
例如答案是“哆啦A梦”,面对一系列提问的答案就是:是活的吗(是)、是虚拟人物吗(是)、是人类吗(不是)……
然而,在玩这个游戏的过程中,研究人员通过测试发现,大模型竟然会根据用户的问题,实时调整自己的答案!
也就是说,无论用户最后猜出的回答是什么,大模型都会调整自己的答案,确保结果和前面用户提的所有问题一致。
然而,在最终问题出来之前,大模型不会事先敲定一个明确的答案,并让用户去猜测。
这表明大模型不会通过扮演角色来实现自己的目标,它的本质只是一系列角色的叠加,并在与人们的对话中逐渐明确自己要扮演的身份,并尽力扮演好这个角色。
这篇文章po出后,引起了不少学者的兴趣。
例如Scale.ai的提示工程师Riley Goodside看完就表示,不要和大模型玩20Q,它并不是在作为“一个人”和你玩这个游戏。
因为,只要随机测试就会发现,每次它给出的答案都会不一样……
也有网友表示这个观点很有吸引力,想证伪还没那么容易:
那么,你认为“大模型本质是在玩角色扮演”这个观点正确吗?
论文链接:
https://www.nature.com/articles/s41586-023-06647-8
—完—
这些「黑话」,产品经理搞懂后少吃亏
产品经理在实际工作中经常会遇到一些“技术黑话”,这些专业术语经常让非技术背景的产品经理们经常不知所云,非常难受。因此,也带来了很多沟通和理解的问题。我之前梳理了一些以通俗的方式来理解“黑话”的方法,这里拿出来再分享下,希望对于非技术背景的产品经理们有所帮助。1、程序员口中的“写死”是什么意思?站长网2023-05-30 18:05:390000高考生换机高峰来了!卢伟冰:Redmi K60、小米13真卖爆了
快科技6月11日消息,一年一度的全国高考已经结束,每年的这个时候都是学生换新手机的高峰。今日,小米集团合伙人、Redmi品牌总经理卢伟冰发文称,昨天是全国高考后的第一天,小米之家非常热闹,K60和小米13是最受欢迎的两款产品,真的是卖爆了。据了解,小米为今年的高考生推出了考生专属1970元券包,完成高考”认证即可领取。站长网2023-06-12 03:42:42000110月共113款国产游戏获批 包括《背包大乱斗 》等
今日,国家新闻出版署发布了2024年10月份国产网络游戏审批信息,共有113款游戏获得许可。在这批获批的游戏中,有几款备受瞩目的作品,例如《背包大乱斗》、《从前有座花果山》、《加菲猫家族:萌宠集结》以及《狼人杀:月夜推理乐园》等,这些游戏涵盖了多种风格和玩法,满足了不同玩家群体的需求。0000华硕计划推出基于英伟达芯片构建的 AI 系统服务 AFS Appliance:企业数据安全可控
华硕计划推出一项服务,让企业能够充分利用生成式人工智能的潜力,同时保持对其数据的控制权。这项名为AFSAppliance的服务的新颖之处在于所有硬件将安装在客户自己的设施中,以维护安全性和控制权。这个基于英伟达公司芯片技术构建的AI计算平台将由华硕运营和更新数据。站长网2023-05-31 11:46:510000超大福利!Runway启动创意合作伙伴计划:为精选用户提供百万积分奖励
文章概要:1.创意合作伙伴计划为选定用户提供无限计划和100万积分。2.计划还提供新功能和AI模型的优先访问权限。3.此举类似YouTube的创作者伙伴计划,有助培育生态系统。AI初创公司Runway最近启动了创意合作伙伴计划,向选定的一组用户提供访问新功能和AI模型的优先权限、免费的无限计划和100万积分。这一计划为Runway的选定用户提供了巨大的福利。站长网2023-08-30 09:50:070000