GPT-4被证实有人类心智!网友:连AI都可以看出他在嘲讽你了
站长网2024-05-27 14:56:150阅
Nature杂志上发表的最新研究显示,GPT-4在心智理论(Theory of Mind, ToM)方面的表现与人类相当,甚至在某些方面超过了人类。这项研究由James W. A. Strachan等人进行,他们通过一系列测试来评估GPT-4、GPT-3.5、Llama2以及人类参与者的表现,并进行了比较。

以下是研究的主要发现:
心智理论的表现:心智理论是理解他人心理状态的能力,对于社会互动至关重要。GPT-4在心智理论方面的表现与人类无异,甚至在检测讽刺和暗示方面优于人类。
测试项目:研究包括了5个测试项目,分别是错误信念、反讽、失言、暗示和奇怪故事。GPT-4在反讽、暗示和奇怪故事这3项测试中的表现明显优于人类,在错误信念测试中与人类持平,仅在失言测试中表现不如人类。
保守性:GPT-4在失言测试中的低分并非因为它缺乏理解能力,而是因为它采取了保守策略,不轻易给出确定性意见。
失言可能性测试:在失言可能性测试中,GPT-4展现了完美的性能,表明它能够成功推断说话者的心理状态,并确定无意冒犯的可能性大于故意侮辱。
能力和表现的分离:研究表明,GPT模型可能具备计算类似心智推理的技术复杂性,但在不确定情况下的表现与人类不同。人类倾向于消除不确定性,而GPT则不会自发地计算推论以减少不确定性。
谨慎行为:GPT-4在失言测试中的保守性可能源于其底层架构中的缓解措施,这些措施旨在提高事实性并避免用户过度依赖模型。
这项研究的结果表明,GPT-4在理解人类心理状态方面的能力可能被低估了。研究者呼吁建立“机器心理学”,使用实验心理学的工具和范式来系统地研究大型语言模型的能力和局限性。
论文地址:https://www.nature.com/articles/s41562-024-01882-z
0000
评论列表
共(0)条相关推荐
6000mAh续航巨无霸!华为畅享70S官宣:5月28日上市
快科技5月24日消息,华为今天公布了一款新机华为畅享70S。官方介绍,这款新机将会在5月28日上午10:08开启预售,目前尚未公布价格和具体配置信息。预热海报显示,华为畅享70S手机提供冰晶蓝、雪域白、曜金黑三款配色,内置6000mAh华为巨鲸超能续航电池,配备AOD高刷护眼屏、畅享X键一键直达。整机外观继承了华为P60系列的设计语言,后摄模组处还显示,该机配备有5000万像素主摄。站长网2024-05-24 17:57:29000010秒钟用AI给你的头像戴上圣诞帽,P图软件可以歇歇了。
马上圣诞节了,于是我这个周日,就给朋友们整了个活。给他们的头像,都用AI,戴上了圣诞帽,来迎接即将到来的圣诞氛围。出乎意料的是,反响居然非常强烈,大家都格外喜欢。。。先给大家看下效果。左边是朋友们的原头像,右边是用AI加上圣诞帽后的图像。试问,谁不想在圣诞节,有一顶属于自己的圣诞帽呢。过往的旧时代,大家想给头像带个圣诞帽玩。都是在各种P图软件里,找各种个样的贴纸。站长网2024-12-23 12:31:350000微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本
划重点:🔍微软研究发布了LLMLingua-2,一种用于任务不可知压缩提示的模型,可以将原始长度减少高达20%,从而降低成本和延迟。📊LLMLingua-2通过智能压缩长提示,去除不必要的词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%。站长网2024-03-25 12:33:460000NVIDIA明年上马3nm!私人定制 但不是游戏卡
快科技9月26日消息,NVIDIA将在明年推出采用台积电3nm级工艺的下一代高性能计算GPUBlackwellGB100,以及下一代加速卡B100。NVIDIA现有的GH100GPU使用的是台积电4nm工艺,而且是定制版。台积电3nm有多种版本,包括性能增强版N3P、高性能计算专属N3X,NVIDIAGB100具体用哪个尚不清楚,估计很可能也会是定制版本。0000逆天!AI也能做游戏?百度智算大会上的这个项目“靓”了
没有代码,没有游戏开发工程,你想象过20分钟内可以制作出一款游戏吗?AI可以创作出爆款文案,写小说,搞视频脚本,写代码,出海报,还能生成3D空间。如今又有一个项目将AI的应用场景延伸到了新领域。没有代码,没有游戏开发工程,你想象过20分钟内可以制作出一款游戏吗?在AI技术的迭代下,这已然成为了现实。0000