GPT-4懒癌爆发!代码比较任务中完成率降低近1/4
划重点:
1. 😟 网友实测发现,GPT-4在代码比较任务中表现下滑,完成率降低了近四分之一。
2. 🔄 有网友指出,新版本的ChatGPT回复虽然长度增加,但很多内容都是车轱辘话,干正事仍然摆烂。
3. 💡 尽管奥特曼表示GPT-4在新的一年应该改进,但网友对其变懒的原因及采用的优化策略仍感困惑。
近期,GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现,GPT-4在代码比较任务中的表现下降显著,完成率降低了近四分之一。一些用户反馈称,完成度不仅不高,而且生成的文本还会被分割成小块,使用时需要逐一复制,给用户带来不便。
尽管有博主表示在尝试给一年级孩子做学习用的小游戏时效果不错,但仍有人质疑ChatGPT的实际应用价值。有网友指出,尽管回复长度增加,但很多内容都是车轱辘话,干正事依旧摆烂。有用户甚至让ChatGPT进行文本翻译测试,结果却叽里呱啦说了一堆却不翻译。
针对这一发现,有人使用GitHub上开源的“lazy benchmark”对比了GPT-4的新旧版本,结果显示新版的完成率较旧版降低了近四分之一。具体而言,在代码比较任务中,旧版能完成的比例为57%,而新版仅为44%。
对于GPT-4变懒的原因,奥特曼并未做进一步说明,仅表示新的一年应该有所改进。之前的研究表明,GPT-4的惰性可能与时间相关,但这并不能完全解释表现不升反降的现象。
不过,网友们总结了一些“土办法”以降低ChatGPT的惰性。例如,告诉它“我没有手指”就能得到相对完整的代码,而不是一段段碎片。另外,告诉ChatGPT自己会“给小费”也能激发其工作动力,其中10美元的小费金额被发现是最能提高性价比的。
GPT-4的“懒惰”问题引起了广泛关注。虽然奥特曼表态在新的一年应该有所改进,但网友们仍对其实际表现及优化策略感到困扰。这一现象或许会在新年伊始有所缓解,但具体的改进措施仍有待进一步揭示。
事关全淘系中小商家,阿里妈妈发布新产品,带来哪些利好?
回归淘宝,是今年以来阿里确定的重要基调,中小商家重新站上C位,针对他们的一系列利好措施在过去大半年密集释放。但对于很多中小商家来说,在一个成熟的电商平台经营,主要难点在于:存在经营门槛、找不到资源投入的方向,也不知道如何对生意进行有效的复盘和优化。站长网2023-08-12 10:05:460000谷歌AI与机器人联手打造新材料
**划重点:**1.🌐谷歌DeepMind的AI系统GNoME预测了近40万种稳定物质,而A-Lab自主系统学会在实验室中制造这些物质。2.⚙️GNoME通过仿真计算提出了220万种潜在化合物,A-Lab则使用最新的机器人技术在18天内制备出41种新型无机材料,其中9种是通过主动学习改进合成过程而获得的。站长网2023-12-01 16:04:270000百度小度进军手机市场 将发布新品牌小度青禾
小度科技CEO景鲲发布朋友圈宣布:“小度手机即将面世,为此推出了全新品牌‘小度青禾’,这是又一种新的物种,敬请期待!”。此前,有消息称,百度旗下小度将进军智能手机市场,并计划在5月下旬发布旗下的第一款智能手机。该手机将整合小度AI技术能力,被称为智能手机市场的“新物种”,目前正处于发布前的最后准备阶段。站长网2023-05-09 15:53:260000Unity 推出 AI Hub 市场和帮助游戏开发的 AI 驱动创意解决方案
Unity距离建立自己的AI生态系统又近了一步。该公司推出了新工具和专门的市场,帮助游戏开发者利用人工智能技术。图片来自Unity在6月27日发布的新博文中,Unity宣布其平台将推出全新的AI驱动创意解决方案。除此之外,该公司还详细介绍了在UnityAssetStore中推出人工智能市场的情况。AI软件市场站长网2023-06-29 11:34:510000脑机接口技术首位受试者用意念在社交平台发帖 马斯克回复
在科技界再次引发轰动的一刻,Neuralink公司的首位芯片植入受试者诺兰·阿博,成功利用意念在社交平台X平台(原推特)上发布了他的第一条帖子。这一成就不仅展示了脑机接口技术的惊人潜力,也标志着人类与机器交互的新纪元。站长网2024-03-23 17:12:030000