Meta可能正开发Llama 3,据称比GPT-4强大、免费开源!
本文要点:
1. Meta可能正在开发比GPT-4更强大的AI大模型Llama3,并保持开源免费。
2.消息称 Llama3计划达到GPT-4的性能水平,但仍将免费提供。然而Meta尚未对此进行官方确认。
3. Llama2在某些应用上达到GPT-3.5水平,但与GPT-4等模型仍有明显差距。Llama3是否能超过GPT-4在技术上还存在不确定性。
据人工智能新闻网站the decoder报道,Meta可能正在开发比GPT-4更强大的AI大模型Llama3,并且保持开源免费。
报道称,这是OpenAI 工程师、前 Google Brain 工程师 Jason Wei 在 Meta 组织的 Generative AI Group 社交活动中听到的消息。

Jason Wei注意到 Meta 现在有足够的计算能力来训练 Llama3和4。他透露,Llama3计划达到GPT-4的性能水平,但仍将免费提供。
不过,Meta目前还没有发表任何关于Llama3何时发布的声明。尽管消息源来自Jason Wei,但其听到的消息也可能有误。
可以参考的是,从2023年2月下旬发布Llama1到2023年7月下旬发布 Llama2, Meta 花了大约五个月的时间。
GPT-4具有比标准版 Llama 更复杂的架构
GPT-4可能通过使用更复杂的混合架构来实现其高性能,该架构具有16个专家网络,每个网络具有约1110亿个参数。
因此,从 Llama2升级到 Llama3可能比简单地通过更多训练进行扩展更具挑战性,并且可能比从 Llama1跳到 Llama2需要更长的时间。
Llama2在某些应用程序中达到了GPT-3.5的水平,同时正在由开源社区通过微调和附加功能进行优化。
例如,最近发布的Code Llama基于 Llama2,通过微调在 HumanEval 编码基准中达到了GPT-3.5和GPT-4级别的结果(取决于测量类型)。
然而,Meta 在论文中指出, Llama2与 GPT-4和Google 的 PaLM-2等闭源模型仍然存在较大的性能差距。
届时Llama3能否比GPT-4更强大还有待观察。
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+
【新智元导读】研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语言生成任务上均表现出显著优势,且不会增加训练时间,推理速度还能提升至三倍。当前,大型语言模型,例如GPT和Llama,主要是根据「前文的单词序列」对「下一个token」进行预测的方式来训练。但你有没有想过一个问题,为什么不对后文的tokens同时进行预测呢?站长网2024-06-03 20:16:360000Jony Ive、OpenAI、孙正义三方合作 10 亿美元风投项目:或打造「人工智能版 iPhone」
站长之家(ChinaZ.com)9月28日消息:据FT报道,前苹果设计师JonyIve和OpenAI的SamAltman正在与软银CEO孙正义进行高级谈判,计划推出一项价值10亿美元的风险投资项目,打造「人工智能版iPhone」。此前有消息称,JonyIve和SamAltman正在商讨开发一款人工智能设备。站长网2023-09-28 17:45:070000V社创始人G胖回顾历史:当初99%的人都不看好Steam
快科技11月24日消息,Valve公司创始人GabeNewell(G胖)在近期的纪录片中,回顾了Steam平台的发展历程,透露当初业界对Steam普遍持怀疑态度。2003年,Steam平台首次发布,最初是为了是方便旗下《反恐精英》、《半条命》等游戏的发售。0000消息称iPhone15数据线升级 1.5米长编织材质USB-C双接口
最近,有消息称苹果公司计划为其即将发布的iPhone15系列手机配备一款全新设计的USB-C数据线。据悉,这款数据线采用编织技术和双接口设计,长度达到1.5米,比现有的Lightning数据线长出50%。数据线的颜色也将与手机机身颜色相匹配,为用户提供更多选择。站长网2023-08-23 16:26:540000戴珊携淘天背水一战
争夺定价权。2023年的双十一,阿里、京东、拼多多、抖音、快手、小红书……,中国几乎所有电商巨头都加入了低价竞争的行列。这样的拼杀,是中国互联网江湖从未有过的景象。全天候科技将借此呈现这个战场中多家公司的切面,观察和预测行业的发展和走向。站长网2023-11-01 17:48:320001