斯坦福研究称:ChatGPT在部分任务表现变蠢 准确率下降
站长网2023-07-20 17:17:204阅
斯坦福大学和加州大学伯克利分校的研究人员发表了一篇论文,研究了 OpenAI 的 ChatGPT 大语言模型(LLM)在2023年3月至6月之间发生的变化。
他们发现,在经过三个月的评估后,ChatGPT 的性能在某些任务上明显恶化。例如,在判断质数和显示思考过程的任务中,GPT-4的准确率下降了95.2%,而 GPT-3.5的准确度大幅上升,提升了79.4%,从7.4%提高到了86.8%。另一个用限定符求一系列整数之和的问题在 GPT-4和 GPT-3.5中也出现了性能下降,分别为负42% 和20%。

与3月份相比,6月份的GPT-4更能抵抗越狱或通过特定提示规避内容保护边界,这一变化很可能被视为该公司的一项改进。
研究人员认为,提高监测和透明度可以避免 LLM 漂移的问题。这项研究揭示了企业在考虑采用生成式 AI 产品时需要注意的新领域,并称之为 “LLM 漂移”。要应对 LLM 漂移的影响,企业需要保持警惕,并进行连续的外部评估和监测。
0004
评论列表
共(0)条相关推荐
腾讯公布显示群消息是否已读专利
企查查APP显示,近日,腾讯科技(深圳)有限公司“消息处理方法、装置、设备、存储介质和程序产品”专利公布。摘要显示,本申请涉及计算机处理技术领域,提供一种消息处理方法、装置、设备、存储介质和程序产品,可以提升消息阅读状态获取效率。站长网2023-07-14 00:35:520000餐饮也不必卷生卷死!被 2000+门店验证的增长解法来了
刘兴春(向南)所在的团队,服务了近37个餐饮连锁品牌,共计2000家线下门店。在“卷生卷死”的餐饮赛道,这个团队凭借私域运营为客户增长提供了有力支持。使得这些餐饮品牌对私域的依赖性越来越高,对平台的抗衡能力也极大增强,摆脱了当下餐饮品牌被平台“裹挟”的困局,跳出了“极致低价”的恶性竞争。站长网2024-06-24 09:45:070000华为与夏普签订长期全球专利交叉许可协议
据华为官方消息,华为与夏普于今日宣布签订一份新的长期全球专利交叉许可协议。该协议覆盖了包括4G和5G在内的蜂窝标准必要专利。华为知识产权部部长樊志勇表示:“该许可协议体现了作为标准贡献者的两家企业对知识产权的相互认可,同时也推动了标准化的合作。”一直以来,我们都致力于与日本及全球同行合作开发技术标准,未来也将持续与同行继续合作。先进的技术标准可提升用户体验,促进竞争,降低设备和服务成本。站长网2023-11-27 10:58:300000《黑神话:悟空》通过ESRB评级!Xbox版本要来了
快科技10月20日消息,近日,《黑神话:悟空》通过了ESRB(娱乐软件分级委员会)的评级的T”评级(青少年级别)。值得注意的是,页面上支持平台显示为WindowsPC,PlayStation5,Xbox平台,这也意味着该游戏将在不久后登陆Xbox平台。而ESRB对《黑神话:悟空》的描述为:这是一款动作角色扮演游戏,玩家扮演天命人,执行寻找六根遗物的使命。站长网2024-10-20 14:05:370000用 GPT-4o 将PRD 即时转换成 Figma 设计
近期,一项由GPT-4o技术支持的新技术引起了行业内的关注。据悉,这项技术可以根据产品需求文档(PRD)自动生成Figma设计稿,为设计师们提供了全新的设计方式。0000