GPT-4懒癌爆发!代码比较任务中完成率降低近1/4
划重点:
1. 😟 网友实测发现,GPT-4在代码比较任务中表现下滑,完成率降低了近四分之一。
2. 🔄 有网友指出,新版本的ChatGPT回复虽然长度增加,但很多内容都是车轱辘话,干正事仍然摆烂。
3. 💡 尽管奥特曼表示GPT-4在新的一年应该改进,但网友对其变懒的原因及采用的优化策略仍感困惑。
近期,GPT-4的“懒惰”现象再度成为热议话题。网友们通过实际测试发现,GPT-4在代码比较任务中的表现下降显著,完成率降低了近四分之一。一些用户反馈称,完成度不仅不高,而且生成的文本还会被分割成小块,使用时需要逐一复制,给用户带来不便。
尽管有博主表示在尝试给一年级孩子做学习用的小游戏时效果不错,但仍有人质疑ChatGPT的实际应用价值。有网友指出,尽管回复长度增加,但很多内容都是车轱辘话,干正事依旧摆烂。有用户甚至让ChatGPT进行文本翻译测试,结果却叽里呱啦说了一堆却不翻译。
针对这一发现,有人使用GitHub上开源的“lazy benchmark”对比了GPT-4的新旧版本,结果显示新版的完成率较旧版降低了近四分之一。具体而言,在代码比较任务中,旧版能完成的比例为57%,而新版仅为44%。
对于GPT-4变懒的原因,奥特曼并未做进一步说明,仅表示新的一年应该有所改进。之前的研究表明,GPT-4的惰性可能与时间相关,但这并不能完全解释表现不升反降的现象。
不过,网友们总结了一些“土办法”以降低ChatGPT的惰性。例如,告诉它“我没有手指”就能得到相对完整的代码,而不是一段段碎片。另外,告诉ChatGPT自己会“给小费”也能激发其工作动力,其中10美元的小费金额被发现是最能提高性价比的。
GPT-4的“懒惰”问题引起了广泛关注。虽然奥特曼表态在新的一年应该有所改进,但网友们仍对其实际表现及优化策略感到困扰。这一现象或许会在新年伊始有所缓解,但具体的改进措施仍有待进一步揭示。
华为:Pura 70标准版不支持星闪 Pro/Pro +/Ultra标配
华为Pura70系列先锋计划已启动,官网现已上架全系列四款新品。然而,近期有部分用户反馈称,他们对Pura70标准版未能支持华为领军的星闪技术表示遗憾。针对此问题,华为终端客服官微在余承东的评论区进行了明确回应:虽然Pura70标准版并不支持星闪技术,但同系列的Pura70Pro、Pura70Pro以及Pura70Ultra均搭载了这一技术。站长网2024-04-19 10:11:570000Meta开发AudioSeal技术,可以秘密为 Deepfake 音频添加水印
**划重点:**1.🌐Meta的研究人员开发了一种方法,在人工智能生成的语音中隐形水印,可用于主动检测AI生成的言论,识别生成它的模型。2.🚀FacebookResearch提出的AudioSeal技术通过水印标记AI生成的语音,以解决对抗合成语音的检测问题,具有高精度和鲁棒性。站长网2024-02-04 14:58:380000苹果再遭集体诉讼: iCloud被指“非法垄断”
快科技3月3日消息,据媒体报道,苹果公司因限制iPhone和iPad用户只能使用iCloud存储特定文件,涉嫌违反反垄断法在美国被提起集体诉讼。美国加利福尼亚州北区地方法院公示的集体诉讼申诉书显示,原告认为苹果公司基于iOS的云存储政策涉嫌非法垄断”原告认为iPhone、iPad等用户只能使用iCloud来备份包括应用程序数据和设备设置等内容,这一做法涉嫌非法垄断”0000iPhone 15系列屏幕供应商全力扩产:供货91% 明年大规模上市
苹果的iPhone15系列智能手机上市已一周多,尽管部分用户反馈该产品在运行时存在过热等问题,但苹果公司仍感受到了强劲的市场需求和持续延长的发货时间。目前,代工生产iPhone15系列的供应商正在全力提高产能,以满足市场的需求。同时,零部件供应商也在积极提供零部件,以支持整机的组装。站长网2023-09-30 13:05:350000