首页站长资讯ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA

ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序 ELIZA

站长网2023-12-08 11:48:421阅

**划重点:**

1. 📉 UC圣迭戈研究人员发现上世纪60年代的ELIZA在图灵测试中胜过OpenAI的ChatGPT。

2. 🤯 ELIZA以27%的成功率模拟人类，而GPT-3.5仅为14%，引发对现代AI技术的尴尬评价。

3. 🧐 有学者认为，ChatGPT并非为在图灵测试中表现良好而设计，而OpenAI的GPT-4在测试中表现更强大。

近日，加利福尼亚大学圣迭戈分校的研究人员进行了一项有趣的实验，将上世纪60年代的计算机程序ELIZA与现代AI聊天机器人ChatGPT进行了图灵测试比较。该研究引发了对OpenAI的尴尬评价，认为ELIZA在这一测试中表现得更为出色。

图灵测试是评估计算机是否能够模拟人类对话的标准，由英国计算机科学家艾伦·图灵于1950年首次提出。在这项最新研究中，研究人员邀请了652名参与者，通过互联网判断他们是在与另一个人还是与AI聊天机器人交流。

结果显示，ELIZA成功模拟人类的能力达到27%，而OpenAI的GPT-3.5仅为14%。引起尤为注目的是，OpenAI的更强大版本GPT-4在测试中的成功率为41%，超过了ELIZA。

对此，AI专家Gary Marcus形容ELIZA的成功对现代科技公司开发AI聊天机器人是一种“尴尬”。然而，一些学者认为，ChatGPT并非被设计用于在图灵测试中表现优异。

美国宾夕法尼亚大学沃顿商学院的AI教授Ethan Mollick在社交媒体上发文表示:“我认为GPT-3.5输给ELIZA并不令人惊讶，当你读完论文后就会明白。OpenAI一直认为模仿风险是一个真正的问题，并采用了RLHF（从人类反馈中进行强化学习），以确保ChatGPT不会试图冒充人类。而ELIZA则更多地是通过利用我们的心理来成功冒充。”

研究中提到，参与者误认ELIZA为人类的原因之一是ELIZA“太糟糕”，以至于被认为是当前AI模型无法达到的水平，因此“更有可能是有意不合作的人类”。

普林斯顿大学计算机科学教授Arvind Narayanan指出:“一如既往，测试行为并不能告诉我们关于能力的信息。ChatGPT被调整为具有正式的语气，不表达观点等，这使得它不太像人类。”

这项名为“GPT-4是否通过图灵测试”的研究尚未经过同行评审。这一发现引发了对现代AI聊天机器人设计和性能的深入思考。

ChatGPT在图灵测试研究中败给上世纪60年代的计算机程序ELIZA

0001

评论列表

共(0)条

相关推荐

站长资讯
植物系穿搭热度不减，商家如何在小红书乘上内容趋势的东风？
把自己打扮成一棵树，去自由拥抱旷野，这是年轻人“去除班味”的新晋计划。在最具生活气息的小红书上，近期最流行的放松项目，是穿上一身“植物系穿搭”拥抱大自然。醒目的苔藓绿搭配着大地色系、米色鹅黄，小雏菊、玫瑰花、甜橙竞相在衣摆、裙裾上绽放，“盛夏”扑面而来。
站长网2024-08-15 23:30:59
0001
2023年4月国产网络游戏版号公布 Switch游戏《愤怒军团》等过审
昨日晚间，国家新闻出版署公布了4月国产网络游戏审批信息。其中，过审游戏包括了《雾境序列》《古龙风云录》《重构:阿塔提斯》《石器时代:觉醒》，以及NS国行游戏《愤怒军团》《噗噗的冒险乐园》等共86款游戏。
站长网站长资讯2023-04-21 08:33:18
0000
站长资讯
新AI框架H2O：将人类动作实时转换为机器人动作可行走、后空翻、踢球等
划重点:1.🔄**框架介绍**:H2O（HumantoHumanoid）是基于强化学习的框架，通过仅使用RGB摄像头实现了全尺寸人形机器人的实时全身遥控操作。2.🔄**数据处理过程**:采用可扩展的“从模拟到实际”处理，通过特权模仿者筛选和选择可行的动作，构建了大规模的重定目标运动数据集。
站长网2024-03-11 11:22:42
0001
站长资讯
重启与OpenAI的谈判，苹果为iOS 18的AI找“备胎”
如果说在AI大模型崭露头角的2023年，苹果方面的做法是观望，那么到了2024年，他们显然已经不再认为这一轮人工智能浪潮是“AI炒作”（AIhype）了。继此前300亿参数规模的MM1模型亮相后，苹果又在不久前在AI开源社区HuggingFace放出了自研的开源“小模型”OpenELM。
站长网2024-05-04 12:36:24
0000
站长资讯
外国小哥疯狂“薅”ChatGPT羊毛同时打4份工
自从ChatGPT火了以后，人们对于人工智能的态度基本上有两种:一种认为AI将抢走大部分人的饭碗，一种认为AI将会成为人们工作中的好帮手。事实上，已经有不少办公室白领在工作中已经用上了ChatGPT。写报告、做PPT等都可以交给ChatGPT来完成。
站长网2023-05-12 20:33:45
0000