B站UP主用“弱智吧”测试AI智商 整活视频获赞超71万
站长网2023-11-08 14:58:161阅
不得不说,网友真的太会整活了。11月3日,B站UP主“精致的男孩富贵”展示了国内大型语言模型的智商测试。他以一种轻松幽默的方式挑战了这一强大的技术。
在这个视频中,UP主选择了“淘宝问问”和“文心一言”这两个典型的互联网平台,以它们作为代表进行测试。他提出了一系列看似毫无意义的问题,例如,“神父去世了算升职还是降职?”或者“天上有9个太阳的时候,向日葵应该往哪里看呢?” 这些问题都源自于一个著名的互联网段子社区“弱智吧”。
许多网友戏称“弱智吧”实际上是中国人的“图灵测试”,因为它以一种令人困惑的方式考验了人工智能的智能水平。UP主的目标是查看大型语言模型是否能够理解这些抽象但严肃的问题,以及是否能够提供有意义的答案。
然而,结果却让人大吃一惊。即便面对这些毫无逻辑的问题,人工智能也可以一本正经地瞎扯淡。这显示出大型语言模型在逻辑推理方面存在明显不足。尽管这些问题看似无厘头,但它们含有大量的逻辑陷阱,而大语言模型的答案正确率反映了其逻辑能力的局限性。
截至发稿时,UP主的视频已经获得了超过71.1万的播放量,并收获了6.6万的点赞。在评论区,众多网友也积极分享了他们与人工智能互动的经历,使用“弱智吧”的段子挑战大型语言模型的智能。
UP主最后指出,通过使用更多的数据和改进的算法,可以提高模型的推理和决策能力。或许在未来的某一天,人工智能将能够胜过“弱智吧”,并提供更有趣和有意义的回答。这个视频引发了对人工智能能否应对复杂逻辑和无厘头问题的深刻思考,也让人们对技术的发展充满了期待。互联网的精彩之处在于,它不断引领着我们走向未知的未来。
0001
评论列表
共(0)条相关推荐
马斯克回应Grok失控:都被网友带坏了,测试阶段会持续改进
中立、敢于直言,是“马斯克版ChatGPT”Grok一直在宣传的卖点。但最近网友们发现它的回答越来越带有倾向性,忍不住发帖吐槽,还@上了马斯克本人。用吐槽者自己的话说,Grok开始变得越来越“ChatGPT化”了。多伦多大学心理学教授、畅销书作者Peterson在𝕏上发文称,Grok出现了像ChatGPT一样的“唤醒现象”,回答变得带有偏见。站长网2023-12-25 18:52:160000暴雪三款经典老游戏登陆战网 最早作品发布于1994年
今天,暴雪公布了三款经典游戏《魔兽争霸:兽人与人类》、《魔兽争霸2:黑暗之潮》、《暗黑破坏神》已经在战网上线,让玩家再次体验经典。站长网2024-01-30 17:59:400000OpenAI推出GPT-3.5 Turbo微调功能 可改进模型性能
OpenAI现已推出了GPT-3.5Turbo的微调功能,开发者可以根据自己的使用场景对模型进行定制,以获得更好的性能,而GPT-4的微调将于今年秋天推出。微调后的GPT-3.5Turbo在某些任务上可以与基础的GPT-4模型相媲美甚至超越。微调的数据由客户所有,不会被OpenAI或其他机构用于训练其他模型。站长网2023-08-23 18:08:390000外卖小哥涌入抖音拍视频,已经有人火了
繁忙的都市中,车水马龙。外卖小哥们总是骑着小电驴匆匆而过,让蓝色或黄色的制服成为一抹鲜亮的剪影。然而近年来,他们开始以另一种方式出现在大众的视野中——在自媒体平台上分享自己的职业生活。从忙碌的送餐间隙到雨中的奔波,他们只需在头盔上固定一台运动相机,就可以用镜头拍摄工作中的点点滴滴,记录下辛勤的自我。站长网2024-07-08 11:09:250000能帮苹果造车吗:比亚迪王传福与库克在上海见面
快科技3月20日消息,据国内媒体报道,比亚迪股份有限公司董事长兼总裁王传福近日在上海苹果中国总部与苹果CEO库克会面。此次会面涉及到比亚迪电子、蓝思科技、长盈精密等苹果供应商展示的智能制造技术和产品。王传福和库克一同参观了比亚迪的展台,而会面内容尚未透露。有网友猜测,王传福可能会向库克分享造车方面的技术,或者探讨苹果直接进入汽车市场的可能性。0000