Meta 发布新多token预测技术,使AI模型速度提升3倍
划重点:
⭐ 研究人员在 Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的一项研究中提出了通过同时预测多个token来改进 AI 大型语言模型(LLMs)的准确性和速度。
⭐ 多token预测使模型在推理时间上提升了3倍,并在生成任务上表现更佳,特别是对于长期模式的学习。
⭐ 这项研究为企业应用提供了更快的推理速度和更高的准确性,特别适用于生成任务,同时与 Transformer 块的其他优化技术兼容。
近期,Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。这与自回归语言模型的经典结构相悖,后者旨在一次预测一个token。
然而,多token预测并非适用于所有类型的模型和语言任务,但在某些领域中提供了重大优势,推理速度提升了3倍,并在生成任务上表现更佳。虽然仍有改进空间,但这项技术可能成为某些 LLM 应用的强大工具。
传统的训练 LLMs 的方法被称为 “下一个token预测”,这是一种自监督学习技术,模型被给定一个token序列,必须预测下一个token。然后将预测的token添加到输入中,重复这个过程,一次预测一个token。在大量文本语料上重复此过程,模型学习了允许它输出连贯文本段落的一般模式。
研究人员已经研究并记录了下一个token预测在获取语言、世界知识和推理能力方面的局限性。新研究的假设是 “训练语言模型同时预测多个未来token会导致更高的样本效率”。
多token预测指示 LLM 同时预测训练语料库中每个位置的多个来token。研究人员提出了一个简单的多token预测架构,不需要额外的训练时间或内存开销。
他们在多种任务上测试了新的多token预测方案,发现在小型模型上,多token预测导更差的结果,但随着模型规模的增加,它变得越来越有用。此外,多token预测还使模型在推理时间上提升了3倍,尤其在 “字节级标记化” 训练上,多字节预测大幅优于基线的单字节预测模型。多token预测仍有改进空间,研究人员正在考虑自动选择最佳预测token数量的技术,以及研究词汇量和多token预测之间的动态关系。
这项研究及其未来的改进对企业应用有用的地方在于,它有可能为生成任务提供更快的推理和更高的准性,几乎不需要额外的成本。同时,它保留了大部分 LLM 架构,可以与 Transformer 块的其他优化技术兼容。
三只羊旗下抖音账号被停播 构成虚假商业宣传
站长之家(ChinaZ.com)9月27日消息:昨日晚间,抖音官方发布公告,宣布自9月21日起,已对“三只羊”公司旗下的抖音账号执行停播措施,并表示将进一步推动该公司进行积极整改,以及合理解决消费者的售后赔付问题。此前,合肥联合调查组已对“三只羊”公司进行了调查,并公布了处理结果:对该公司作出包括没收非法所得和罚款在内的处罚,总额高达6894.91万元。0000毕马威研究:生成式AI有望重塑工作场所效率,彻底改变工作
根据毕马威(KPMG)最近进行的一项调查,生成式人工智能对业务运营的影响正在迅速增长,对劳动力产生深远影响。调查结果显示,72%的受访者认为生成式AI有潜力显着提高其组织内的生产力。此外,66%的参与者预计未来工作环境将发生转变,而62%的参与者认识到人工智能能够激发创新并促进新产品和服务的开发。该公司认为,这些结果凸显了生成式AI在推动组织成功以及培养创造力和进步方面日益重要。站长网2023-05-26 15:53:310000问界新M7累计大定突破12万台:月交付能力将达3万台
快科技12月26日消息,据媒体报道,问界新M7累计大定已突破12万台,其中,智驾版占比60%、后驱版占比60%。问界官方表示:自2024年1月起,问界M7的交付能力将达到3万台。此外,问界官方还推出了新的提车不跨年”购车政策,所有在2024年1月31日前下订的客户,如果在2024年2月8日之前还没提车,则可在交车时获得3000元的现金补偿。0000苹果A17芯片性能曝光:比上代提升近50%
从目前泄露的信息来看,新的A17芯片将配备6核CPU和6核GPU,相比目前的A16芯片,GPU核心数量增加了一个。此外,A17芯片的最大主频也将从3.46GHz提升到3.70GHz。据一位国外博主预测,A17芯片组的MetalGPU跑分高于M1。按照这位博主的预测,A17在Geekbench6下的分数将是29425,比M1高出17%(24907),比A16高出近50%。站长网2023-08-12 11:04:160000马斯克到访特斯拉上海超级工厂 陶琳深夜发声:激动人心 收获满满
快科技6月1日消息,时隔三年再次访华的特斯拉创始人、CEO马斯克此前结束了在北京的工作,昨天晚上就乘坐私人飞机到了上海,深夜就去上海的超级工厂,会见了国内工厂的高管及员工。6月1日凌晨0时28分,特斯拉对外事务副总裁陶琳深夜通过微博发声,发布了两张照片,是马斯克与员工的大合影,配文表示感谢所有的支持!收获满满的一天!”,微博显示的地点也是上海超级工厂。站长网2023-06-01 14:54:570001