Human or Not游戏测试:三分之一的人分不清人和AI
站长网2023-06-01 16:16:440阅
日前,OpenAI 的竞争对手AI21Labs发布了一项名为“ Human or Not ”的网络游戏社交实验的结果,该游戏发现高达32% 的人无法区分人类和 AI 机器人。
该公司称这款游戏是迄今为止规模最大的图灵测试,它使用基于领先的大型语言模型 (LLM)(例如 OpenAI 的 GPT-4和 AI21Labs的Jurassic-2、最终分析了超过一百万次的对话和猜测。
结果令人诧异:一方面,测试表明,人们发现更容易识别对象是不是同类(即人类),参与者猜对率73% 。但在与机器人交谈时,参与者只猜对率只有60% 。
但除了这些数字之外,研究人员还指出,参与者使用了几种流行的方法和策略来确定他们是在与人交谈还是与机器人交谈。例如,他们假设机器人不会犯拼写错误、语法错误或使用俚语,而在游戏中的大多数模型都经过训练可以犯这些类型的错误并使用俚语。
参与者还经常问一些个人问题,例如“你来自哪里?”、“你在做什么?” 或“你叫什么名字?”,相信人工智能机器人不会有个人历史或背景,而且他们的回答将仅限于某些主题或提示。然而,机器人大多能够回答这些类型的问题,因为它们接受过很多个人故事的训练。
在两分钟的对话之后,用户被要求猜测他们一直在人还是机器人对话。经过一个多月的游戏和数百万次对话,结果表明32% 的人无法区分人类和人工智能。
些参与者认为,如果他们的讨论伙伴过于礼貌,他们可能是一个机器人。
0000
评论列表
共(0)条相关推荐
微软推出用于 Azure AI Health Insights 的新 AI 模型
站长之家(ChinaZ.com)10月12日消息:微软通过AzureHealthInsights发布了一系列专为医疗保健行业定制的数据和人工智能产品。这些工具旨在帮助医疗机构利用其产生的大量数据,从而改善患者护理并简化运营。利用MicrosoftFabric改善医疗保健站长网2023-10-12 15:43:490000数据分析利器!MediaCrawler支持一键抓取小红书、抖音等平台内容
随着社交媒体的普及,越来越多的人开始使用小红书、抖音、快手、B站和微博等平台来分享自己的生活和创作。然而,有时我们可能需要将这些平台上的视频、图片、评论、点赞和转发等信息进行抓取,以便于后续的数据分析和处理。这时,我们可以借助一款名为MediaCrawler的工具来实现这一目标。项目地址:https://github.com/NanmiCoder/MediaCrawler站长网2024-03-18 22:58:270008你会玩吗 周鸿祎称掼蛋对个人社交很重要
快科技2月1日消息,掼蛋”近日成为了网友热议的话题,不少大佬也为掼蛋站台,称其是社交神器”。周鸿祎认为掼蛋对社交很重要,所谓吃饭不掼蛋,等于不吃饭”。刘强东曾笑称如果要有掼蛋的话,我相信(读书时)每一个宿舍都在打掼蛋;”俞敏洪也曾表示,热爱打掼蛋很好,我也热爱打,但是天天打掼蛋就没什么意思了。”国内多位互联网大佬都表示掼蛋好玩,在社交时也很重要,那么问题来了,你会玩吗?0000余承东将出任母校霍邱二中鸿蒙班名誉班主任
根据霍邱县第二中学的公众号消息,该校计划任命华为常务董事、终端BGCEO余承东为“鸿蒙班”的名誉班主任。该班级以“鸿蒙初开,万物生辉;以梦为马,未来可期”为宗旨,是霍邱二中从2021年开始重点打造的优秀班级。据了解,鸿蒙班的中考总分要求为656分及以上,学生将接受个性化培养,采取一对一导师指导的方式。0000央视联合上海人工智能实验室发布央视听媒体大模型CMG Media GPT
7月20日,上海人工智能实验室(上海AI实验室)、中央广播电视总台联合发布“央视听媒体大模型”(CMGMediaGPT)。目前,央视听大模型具备了强大的视频理解能力和视听媒体问答能力,同时,央视听大模型可根据提供的视频创作文字——从主持词到新闻稿件,甚至诗歌。媒体编辑可在大模型的协助下,一键为视频生成风格各异的解说词,当前生成内容已覆盖美食、文化和科技等多个领域。站长网2023-07-24 12:04:420001