ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA
**划重点:**
1. 📉 UC圣迭戈研究人员发现上世纪60年代的ELIZA在图灵测试中胜过OpenAI的ChatGPT。
2. 🤯 ELIZA以27%的成功率模拟人类,而GPT-3.5仅为14%,引发对现代AI技术的尴尬评价。
3. 🧐 有学者认为,ChatGPT并非为在图灵测试中表现良好而设计,而OpenAI的GPT-4在测试中表现更强大。
近日,加利福尼亚大学圣迭戈分校的研究人员进行了一项有趣的实验,将上世纪60年代的计算机程序ELIZA与现代AI聊天机器人ChatGPT进行了图灵测试比较。该研究引发了对OpenAI的尴尬评价,认为ELIZA在这一测试中表现得更为出色。
图灵测试是评估计算机是否能够模拟人类对话的标准,由英国计算机科学家艾伦·图灵于1950年首次提出。在这项最新研究中,研究人员邀请了652名参与者,通过互联网判断他们是在与另一个人还是与AI聊天机器人交流。
结果显示,ELIZA成功模拟人类的能力达到27%,而OpenAI的GPT-3.5仅为14%。引起尤为注目的是,OpenAI的更强大版本GPT-4在测试中的成功率为41%,超过了ELIZA。

对此,AI专家Gary Marcus形容ELIZA的成功对现代科技公司开发AI聊天机器人是一种“尴尬”。然而,一些学者认为,ChatGPT并非被设计用于在图灵测试中表现优异。
美国宾夕法尼亚大学沃顿商学院的AI教授Ethan Mollick在社交媒体上发文表示:“我认为GPT-3.5输给ELIZA并不令人惊讶,当你读完论文后就会明白。OpenAI一直认为模仿风险是一个真正的问题,并采用了RLHF(从人类反馈中进行强化学习),以确保ChatGPT不会试图冒充人类。而ELIZA则更多地是通过利用我们的心理来成功冒充。”
研究中提到,参与者误认ELIZA为人类的原因之一是ELIZA“太糟糕”,以至于被认为是当前AI模型无法达到的水平,因此“更有可能是有意不合作的人类”。
普林斯顿大学计算机科学教授Arvind Narayanan指出:“一如既往,测试行为并不能告诉我们关于能力的信息。ChatGPT被调整为具有正式的语气,不表达观点等,这使得它不太像人类。”
这项名为“GPT-4是否通过图灵测试”的研究尚未经过同行评审。这一发现引发了对现代AI聊天机器人设计和性能的深入思考。
国内首批太空船票上架 票价150万:可在淘宝购买 订金5万
国内民营航天企业深蓝航天于10月23日宣布,将预售两张2027年亚轨道旅行的飞船坐席,每张票价定为150万元,这标志着中国太空旅行向公众迈出了重要一步。此次预售的太空船票是国内首张通过淘宝平台销售的太空旅行票,预示着太空探索可能即将进入大众时代。站长网2024-10-24 15:56:560000BlindChat:一个完全在浏览器运行对话式 AI 开源项目
文章概要:-BlindChat是一个由MithrilSecurity推出的开源项目,旨在打造全球首个完全在浏览器内运行的对话人工智能,保护用户隐私。-通过在本地推理或使用安全的隔离环境,BlindChat确保用户数据始终保持私密,用户拥有完全控制权。-该项目具有两种隐私选项,一种是在设备上下载模型并在本地处理推理,另一种是使用零信任AIAPI进行远程推理,提供了强大的隔离和验证。站长网2023-09-25 16:27:510000字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登
字节跳动版ChatGPT,现在人人可玩了!网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。并且无需排队,打开就能和这个名叫“豆包”的AI助手直接开聊。是doubao.com不是douban.com噢~消息一出,已经有不少胖友第一时间前往围(tiao)观(xi)。我们也抓紧实测了一波~与ChatGLM难分伯仲先来看看豆包是怎么介绍自己的:站长网2023-08-19 16:06:520000百度推出文心一言专业版尊享礼品卡 12个月会员限时658.8元
近期,百度文心一言推出了专业版尊享礼品卡,用户可以登录官网购买电子礼品卡送给朋友。具体价格方面,1个月59.9元、3个月179.7元、6个月359.4元、12个月限时658.8元(原价718.8元)。此次推出的尊享礼品卡具有多项升级功能。其中,全面升级的文心大模型4.0将为用户提供更强大的语言理解和生成能力。同时,礼品卡还支持更长的输入输出,以满足用户在各种场景下的需求。站长网2023-12-21 14:43:540000英特尔计划在德建厂想要100亿补贴 德财长:太多了给不起
美国英特尔公司计划在德国建立一家芯片工厂,获得了德国政府68亿欧元的补贴,但据英国《金融时报》6月11日报道,英特尔希望进一步从政府获取32亿欧元的补贴使总金额达到约100亿欧元,然而德国财政部长林德纳表示“给不起”。据报道,英特尔要求更多补贴是因为能源和施工成本上升,但林德纳表示德国政府在预算范围内,无法为英特尔提供更多的补贴。目前,德国政府正在努力整合预算,而不是扩充。站长网2023-06-12 22:57:130000