ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA
**划重点:**
1. 📉 UC圣迭戈研究人员发现上世纪60年代的ELIZA在图灵测试中胜过OpenAI的ChatGPT。
2. 🤯 ELIZA以27%的成功率模拟人类,而GPT-3.5仅为14%,引发对现代AI技术的尴尬评价。
3. 🧐 有学者认为,ChatGPT并非为在图灵测试中表现良好而设计,而OpenAI的GPT-4在测试中表现更强大。
近日,加利福尼亚大学圣迭戈分校的研究人员进行了一项有趣的实验,将上世纪60年代的计算机程序ELIZA与现代AI聊天机器人ChatGPT进行了图灵测试比较。该研究引发了对OpenAI的尴尬评价,认为ELIZA在这一测试中表现得更为出色。
图灵测试是评估计算机是否能够模拟人类对话的标准,由英国计算机科学家艾伦·图灵于1950年首次提出。在这项最新研究中,研究人员邀请了652名参与者,通过互联网判断他们是在与另一个人还是与AI聊天机器人交流。
结果显示,ELIZA成功模拟人类的能力达到27%,而OpenAI的GPT-3.5仅为14%。引起尤为注目的是,OpenAI的更强大版本GPT-4在测试中的成功率为41%,超过了ELIZA。
对此,AI专家Gary Marcus形容ELIZA的成功对现代科技公司开发AI聊天机器人是一种“尴尬”。然而,一些学者认为,ChatGPT并非被设计用于在图灵测试中表现优异。
美国宾夕法尼亚大学沃顿商学院的AI教授Ethan Mollick在社交媒体上发文表示:“我认为GPT-3.5输给ELIZA并不令人惊讶,当你读完论文后就会明白。OpenAI一直认为模仿风险是一个真正的问题,并采用了RLHF(从人类反馈中进行强化学习),以确保ChatGPT不会试图冒充人类。而ELIZA则更多地是通过利用我们的心理来成功冒充。”
研究中提到,参与者误认ELIZA为人类的原因之一是ELIZA“太糟糕”,以至于被认为是当前AI模型无法达到的水平,因此“更有可能是有意不合作的人类”。
普林斯顿大学计算机科学教授Arvind Narayanan指出:“一如既往,测试行为并不能告诉我们关于能力的信息。ChatGPT被调整为具有正式的语气,不表达观点等,这使得它不太像人类。”
这项名为“GPT-4是否通过图灵测试”的研究尚未经过同行评审。这一发现引发了对现代AI聊天机器人设计和性能的深入思考。
Meta AI 发布 MMCSG数据集:使用 Project Aria 捕获的 25 小时以上的双向对话
划重点:-💡CHiME-8MMCSG任务专注于通过智能眼镜录制的对话转录挑战,旨在帮助研究人员解决活动检测和说话者分离等问题。-💡提出的模型利用多模态数据集MSCSG数据集,包括音频、视频和IMU信号,以提高转录准确性。-💡通过整合各种技术来改善实时对话的转录准确性,包括目标说话者识别/定位、说话者活动检测、语音增强、语音识别和对话。0000谷歌似乎正在开发一款需要付费的 “高级版” Bard
划重点:-谷歌似乎正在开发一款名为“BardAdvanced”的升级版本,用户需通过谷歌One付费订阅来使用。-BardAdvanced似乎由谷歌新推出的大型语言模型(GeminiUltra)提供支持,比当前版本的Bard(GeminiPro)升级了功能。站长网2024-01-05 09:38:420000vivo S18 Pro发布:售价3199元起
vivoS18Pro正式发布,售价分别为12GB256GB售价3199元,16GB256GB售价3499元,16GB512GB售价3699元。vivoS18Pro采用6.78英寸120Hz朝阳护眼屏,搭载联发科天玑9200芯片,前置5000万像素,电池5000毫安时并支持80W有线闪充。0001苹果Vision Pro虚拟现实耳机上市数量极其有限 预计很快售罄
根据天风国际证券分析师郭明池的预测,苹果即将推出的VisionPro虚拟现实耳机可能会很难买到。郭明池周四在社交媒体上表示,鉴于苹果只计划生产6万至8万台这款定价3499美元的虚拟现实耳机,加之它将在2月2日发布,他预计这些耳机有可能会很快售罄。0000Chato:基于AI技术 轻松定制个性化助理机器人
Chato是一款基于AI技术的对话机器人平台,可以帮助用户快速创建个性化、具有超强能力的助理机器人。用户只需上传学习素材或添加提示语,即可定制专属机器人,满足不同的业务需求。官网地址:https://chato.cn/?channel=qqaiyjsChato的核心功能包括:-快速创建机器人:用户只需花费20秒就可以快速创建一个机器人,无需编写代码或具备专业知识。站长网2023-07-27 11:58:110001