Human or Not游戏测试:三分之一的人分不清人和AI
站长网2023-06-01 16:16:440阅
日前,OpenAI 的竞争对手AI21Labs发布了一项名为“ Human or Not ”的网络游戏社交实验的结果,该游戏发现高达32% 的人无法区分人类和 AI 机器人。
该公司称这款游戏是迄今为止规模最大的图灵测试,它使用基于领先的大型语言模型 (LLM)(例如 OpenAI 的 GPT-4和 AI21Labs的Jurassic-2、最终分析了超过一百万次的对话和猜测。
结果令人诧异:一方面,测试表明,人们发现更容易识别对象是不是同类(即人类),参与者猜对率73% 。但在与机器人交谈时,参与者只猜对率只有60% 。
但除了这些数字之外,研究人员还指出,参与者使用了几种流行的方法和策略来确定他们是在与人交谈还是与机器人交谈。例如,他们假设机器人不会犯拼写错误、语法错误或使用俚语,而在游戏中的大多数模型都经过训练可以犯这些类型的错误并使用俚语。
参与者还经常问一些个人问题,例如“你来自哪里?”、“你在做什么?” 或“你叫什么名字?”,相信人工智能机器人不会有个人历史或背景,而且他们的回答将仅限于某些主题或提示。然而,机器人大多能够回答这些类型的问题,因为它们接受过很多个人故事的训练。
在两分钟的对话之后,用户被要求猜测他们一直在人还是机器人对话。经过一个多月的游戏和数百万次对话,结果表明32% 的人无法区分人类和人工智能。
些参与者认为,如果他们的讨论伙伴过于礼貌,他们可能是一个机器人。
0000
评论列表
共(0)条相关推荐
英伟达发布新型 Perfusion AI 图像生成器:只需 100KB 模型大小 就可创造性地描绘物体
在人工智能艺术创作工具的快速发展中,英伟达的研究人员推出了一种创新的文本到图像个性化方法,名为Perfusion。但与竞争对手相比,它并不是一个价值百万美元的超级大型模型。Perfusion的大小只有100KB,训练时间只需4分钟,能够在表达个性化概念时保持其特性,同时具有显著的创造性和灵活性。图片来自Nvidia站长网2023-08-02 15:47:200000格力玫瑰空调上热搜:售价29999元 专为新婚人群设计
站长之家(ChinaZ.com)1月3日消息:近日,格力玫瑰空调因其独特造型和售价引发网友热议。据董明珠透露,这款空调是专为新婚人群设计的。然而,这款专为新婚人群准备的空调售价高达29999元。数据显示,格力玫瑰是一款3匹变频高端立柜式冷暖空调,具备双向流新风换气功能。该款空调采用圆柱空调高端柜机设计,型号为KFR-72LW/(72501)FNhAa-B1,价格为29999元。站长网2024-01-03 16:34:420001深入解析SDXL潜在空间以及如何改善其生成图像的方法
要点:SDXL潜在空间包括4个通道,分别是亮度、青/红、绿/紫、图案/结构。SDXL生成的颜色范围偏向黄色,原因是模型在生成过程中更偏向认知中的亮度、青/红、绿/紫,而相对较少使用蓝色。通过实验性地探索SDXL潜在空间,作者提出了一些纠正SDXL输出的方法,包括去除异常值、平衡颜色、增加颜色范围等。站长网2023-11-24 11:32:320006德克萨斯州大学将建立学术界最大之一的生成式AI中心
德克萨斯州奥斯汀-德克萨斯大学奥斯汀分校(UT)正在建立一个学术界最强大的人工智能中心,以引领研究并为广泛的合作伙伴提供世界一流的人工智能基础设施。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-01-30 16:01:340002基于GPT-4的AI律师“Do Not Pay” 帮用户推翻了16万多张停车罚单
随着人工智能应用到消费者法,用户获得退款赔偿的门槛可能进一步降低。DoNotPay是由GPT4支持的人工智能律师机器人,可以通过为停车罚单辩解、协商交易退款和分析财务交易来帮助用户节省金钱。该机器人由GPT4提供支持,接受了西方主要国家消费者法律和法规的培训,可以撰写引用具体立法的有说服力的信件,并代表用户通过电子邮件发送给公司,从而为他们节省金钱。站长网2023-07-31 10:23:390000