GPT-4在图灵测试中成功率超过41%,人类保持在63%
站长网2023-11-27 11:45:130阅
**划重点:**
1. 🧪 图灵测试研究中,GPT-4成功率达到41%,人类有63%。
2. 🤯 对比GPT-3.5和GPT-4,显示付费版本在测试中表现更出色。
3. 🧠 图灵预测的计算能力要求未实现,人工智能仍有进步空间。
近期,Jones和Bergen进行了一项关于GPT-4在图灵测试中的研究,结果显示其成功率超过41%。
这一数字相比于传统的人工智能模型,如ELIZA的27%和GPT-3.5的14%,表现出明显的优势。研究设计了25个不同的语言模型,涵盖了各种GPT的版本,其中包括GPT-4。这些模型使用类似于手机消息应用的界面,并在拼写错误、大小写、延迟等方面引入了小的随机变化。
图灵测试是通过与人类进行对话,然后判断对方是人类还是人工智能的测试。与原始的图灵测试不同,这项研究的测试设计更简化,要求参与者在最多5分钟的时间内进行对话,每条消息不超过300字符。共有652名人类参与者完成了1810次测试。
1950年,艾伦·图灵曾预测,到了他认为的未来50年,计算机将具备足够的存储能力,以70%的概率“欺骗”人类。然而,研究表明,即使到了现在,GPT-4等模型也未达到这一水平,最高成功率仅为41%。
图源备注:图片由AI生成,图片授权服务商Midjourney
有趣的是,研究指出GPT-4是付费版本,而GPT-3.5则是免费版本。这表明,付费版本在测试中表现更好,凸显了技术进步对结果质量的影响。
人工智能在图灵测试中取得的进展令人印象深刻,但与人类63%的成功率相比,仍有改进的空间。这一研究进一步探讨了人工智能的发展趋势,揭示了技术的潜在局限性。
0000
评论列表
共(0)条相关推荐
91%企业AI领袖相信生成式AI能提升效率
**划重点:**-📊**调查结果:**Deloitte调查2,835名企业高管,62%对生成式AI充满热情,79%预计未来三年内公司将发生重大变化。-💡**应用方向:**56%公司专注于提高效率和生产力,仅有29%寻求创新和增长。91%相信生成式AI能提升效率,其中27%认为效果显著。站长网2024-01-16 12:50:240000钉钉上线敲一敲木鱼功能 用户数达 7 亿人
1月9日,钉钉举办了盛大的7.5产品发布会。在此次发布会上,钉钉对外公布了最新的用户数字和商业化数字。据数据显示,截至2023年底,钉钉的用户数已经达到了惊人的7亿,各类组织数量也达到了2500万,包括企业和学校等。同时,付费DAU达到了2800万,软件付费企业数更是高达12万。除此之外,钉钉在发布会上还宣布了另一个重磅消息:截至目前,钉钉已有20条产品线、80多个场景全面接入大模型。站长网2024-01-09 11:35:160001PC掌机这块蛋糕,如今英伟达似乎也看上了
如今这一波AI浪潮的引领者显然非OpenAI莫属,从ChatGPT到GPT-4、再到Sora,无不证明了OpenAI的成功,但这家公司并不没有吃到最大红利,真正闷声发大财的反而是英伟达。英伟达所扮演的无疑是“淘金热中卖水”的角色,向AI厂商出售算力成就了其公司市值在2023年上涨238%,到了2024年继续大涨66%的关键。站长网2024-03-17 17:42:070000研究表明 ChatGPT 可以比人类更准确地预测股票价格走势
人工智能正在改变各个行业,金融领域也不例外。美国佛罗里达大学的研究人员最近进行的一项研究表明,大型语言模型驱动的人工智能ChatGPT可以使用新闻标题的情感分析来准确预测股票市场的回报。站长网2023-05-12 20:29:120000各平台先后推出直播技术服务费,目前淘宝费率最低
只有加大技术投入,才能提供优质服务。随着直播产业的蓬勃发展,加大技术投入已经成为普遍共识。直播技术服务费,也已成为行业惯例。目前,各大平台收费水准略不同,主流平台费率均为5%左右。站长网2024-03-18 15:27:070000