OpenAI承认GPT-4变懒,即将发布修复方案提升性能
站长网2023-12-11 14:51:150阅
**划重点:**
1. 🤯 用户反馈:GPT-4使用者抱怨OpenAI破坏了体验,称模型几乎“害怕”提供答案。
2. 🕵️♂️ 问题认知:OpenAI承认性能问题,归因于模型训练数据变化,试图提高准确性却导致意外的懒散行为。
3. ⏳ 修复时间表:OpenAI未明确发布修复计划的确切时间,但强调高度重视,并将密切关注竞争对手,如Google的Gemini1.0。
近期,OpenAI的GPT-4引起了广泛关注,使用者纷纷抱怨模型变得“懒散”且不愿提供答案。OpenAI在社交平台X上承认了这一问题,表示模型自11月11日以来未进行更新,并强调这并非故意设计。
针对用户的批评,OpenAI承认了GPT-4的性能问题,并将其归因于对模型微调所用训练数据的变更。尽管这一变更旨在提高准确性和减少偏见,但却不慎导致了观察到的懒散现象。一些使用者表示,模型似乎变得几乎“害怕”提供答案,而其他人则表示现在需要更精确的提示,而这在以前是可选的。
图源备注:图片由AI生成,图片授权服务商Midjourney
OpenAI为其立场辩护,声称模型自11月12日以来未发生变化,但问题在于“模型行为的差异可能很微妙”,只有特定的提示可能会“退化”。尽管进行了这些修改,但OpenAI警告称使用者和员工可能需要一些时间才能识别这些模式。
至于修复的时间表,OpenAI尚未提供确切的实施计划,但他们强调这是一个高优先级的任务,并正在努力解决问题。OpenAI没有为新的更新模型指定发布日期,但肯定会密切关注竞争对手,特别是Google推出Gemini1.0系列的情况。
GPT-4所面临的挑战突显了开发和部署大型语言模型的复杂性。OpenAI对解决问题的透明度和承诺为未来AI发展提供了宝贵的见解。
0000
评论列表
共(0)条相关推荐
360智脑-视觉大模型发布 周鸿祎:多模态大模型与物联网结合是风口
站长之家(ChinaZ.com)6月1日消息:周鸿祎在5月31日晚间的三六零智慧生活集团视觉大模型及AI硬件新品发布会上,发布了专业视觉及多模态大模型“360智脑-视觉大模型”。360智脑视觉大模型基于10亿级互联网图文数据进行清洗训练,并针对安防行业数据进行微调,融合千亿参数的"360智脑"大模型,从视觉感知能力角度进行打造。站长网2023-06-01 16:39:400000谷歌的Bard在聊天机器人排名中击败了GPT-4
**划重点:**1.🚀Bard的GeminiPro版本在LMSYS聊天机器人榜上超越了GPT-4,标志着聊天机器人领域的重大变革。2.📈Bard现在是LMSYS榜上第二高分的聊天机器人,正在迎头赶上保持冠军的GPT-4Turbo。3.💡Bard的崛起得益于搭载谷歌最新的GeminiPro大型多模态模型,成为该榜上第二个获得超过1200分的模型。站长网2024-02-01 12:07:170000Humane 正式推出 AI Pin:一款由 OpenAI GPT-4 驱动的人工智能可穿戴设备
Humane公司于当地时间周四揭开了其首款设备——AIPin的神秘面纱,这标志着人工智能驱动的未来设备可能是什么样子的揭示。图片来自Humane站长网2023-11-10 09:34:580005keep通过港交所上市聆讯 一季度营收4.47亿元
据港交所公开信息显示,运动科技公司Keep已通过上市聆讯。招股书披露,招股书显示,2020年至2022年,Keep营收分别为11亿元、16亿元和22亿元。毛利分别为4.99亿元、6.77亿元、9亿元。经调整亏损净额分别为1.06亿元、8.27亿元及6.67亿元。截至2023年3月31日,Keep平台平均月活跃用户数为2626万。站长网2023-06-26 00:57:270000谷歌推出ASPIRE框架 让大模型具备自我判断意识
谷歌最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf?ref=maginative.com站长网2024-02-07 09:40:450000