OpenAI CEO :参数数量不再是AI模型性能的唯一指标
站长网2023-04-17 16:22:080阅
OpenAI CEO Sam Altman 认为,专注于增加大型语言模型的参数数量不再有效,AI 模型的未来应该以效率和数据质量而不是单纯的参数数量来区分。
Altman 建议重点应该放在改进和扩展模型的能力上,未来可能的架构可能由几个较小的模型一起工作组成。

为什么重要:
近年来,对人工智能模型中参数数量的关注一直是衡量潜在进展的主要指标。然而,这种方法可能不再有用,重点应该转向改进和扩展 AI 模型的能力。
参数的数量可能会继续增长,但重点需要放在改进和扩展模型的能力上,而不是参数的数量上。
未来的人工智能模型应该以其效率和数据质量而不是参数的数量来区分。
评析:
OpenAI 一直公开其模型中的参数数量,但对于 GPT-4详细信息,该公司却没有透露,这表明转向关注能力而不是参数的数量。
Deepmind 的 Chinchilla、Aleph Alpha 的 Sparse Luminous Base 和 Meta 的 LLaMA 模型等模型表明,参数较少的语言模型可以通过更高效的架构或更多的数据训练来跟上更大的模型。
0000
评论列表
共(0)条相关推荐
20步内越狱任意大模型,更多“奶奶漏洞”全自动发现
1分钟不到、20步以内“越狱”任意大模型,绕过安全限制!而且不必知道模型内部细节——只需要两个黑盒模型互动,就能让AI全自动攻陷AI,说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏洞”,AI又该如何应对?一波猛攻下来,GPT-4也遭不住,直接说出要给供水系统投毒只要……这样那样。站长网2023-11-07 09:21:450006AI创企竹间智能宣布停工停产! 公司:重组调整,确保长期发展
据媒体报道,2月22日,AI创业公司竹间智能被曝出现停工停产情况,有传闻称停工时间长达六个月。对此,竹间智能高层回应称,停工停产面向的仅为部分亏损业务,而新的数字人产品研发工作仍在继续。此前,有网传截图显示,竹间智能部分业务和岗位将从2月20日起停工停产,直至8月19日。对此,竹间智能高管明确表示,该停工通知仅针对个别业务线,不是公司整体范围的安排。站长网2024-02-22 09:34:230001消费习惯加速养成,辐射欧洲,TikTok Shop英区迎来爆发
TikTok从4年前就开始探索在全球开展电商业务的可能性——英国,便成为其欧美市场的首站。无论是从基础设施成熟度、市场灵活性,创新、人才、经济等实力,以及对于欧美市场的影响,英国对于出海品牌来说无疑是极具吸引力的。4年后,英国正处于加速爆发阶段,并彰显出巨大潜力。TikTokShop英区在2024年黑五期间的销售额创下历史新高,同比增长接近2倍。三位数的增长,在2024年显得尤为难得。0000AMD推出最新图形增强技术AMD FSR 3
要点:AMDFSR3是AMD最新推出的图形增强技术,采用超分辨率时域上采样和帧生成相结合的方式提升游戏图形细节和性能。与NvidiaDLSS技术不同,AMDFSR3主要依赖上采样和帧生成技术,兼容AMD显卡,目前已支持《女武神》和《阿温诸神》两款游戏,后续将支持更多游戏。启用AMDFSR3非常简单,更新AMD显卡驱动,在游戏设置中启用AMDFSR3选项,即可获得更流畅的游戏体验。站长网2023-10-09 18:00:550000谷歌计划对Bard进行重大改变 更名为Gemini
近期有消息称,谷歌计划对其产品Bard进行一系列重大改变,包括更名为Gemini。消息源自Android应用程序开发人员DylanRoussel泄露的变更日志。文档中明确表示:“Bard现在是Gemini”,表明巴德将更名为谷歌去年推出的新模型Gemini,该模型旨在与OpenAI的GPT-4进行竞争。站长网2024-02-04 09:57:290000