Meta 发布新多token预测技术,使AI模型速度提升3倍
划重点:
⭐ 研究人员在 Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的一项研究中提出了通过同时预测多个token来改进 AI 大型语言模型(LLMs)的准确性和速度。
⭐ 多token预测使模型在推理时间上提升了3倍,并在生成任务上表现更佳,特别是对于长期模式的学习。
⭐ 这项研究为企业应用提供了更快的推理速度和更高的准确性,特别适用于生成任务,同时与 Transformer 块的其他优化技术兼容。
近期,Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。这与自回归语言模型的经典结构相悖,后者旨在一次预测一个token。
然而,多token预测并非适用于所有类型的模型和语言任务,但在某些领域中提供了重大优势,推理速度提升了3倍,并在生成任务上表现更佳。虽然仍有改进空间,但这项技术可能成为某些 LLM 应用的强大工具。
传统的训练 LLMs 的方法被称为 “下一个token预测”,这是一种自监督学习技术,模型被给定一个token序列,必须预测下一个token。然后将预测的token添加到输入中,重复这个过程,一次预测一个token。在大量文本语料上重复此过程,模型学习了允许它输出连贯文本段落的一般模式。
研究人员已经研究并记录了下一个token预测在获取语言、世界知识和推理能力方面的局限性。新研究的假设是 “训练语言模型同时预测多个未来token会导致更高的样本效率”。
多token预测指示 LLM 同时预测训练语料库中每个位置的多个来token。研究人员提出了一个简单的多token预测架构,不需要额外的训练时间或内存开销。
他们在多种任务上测试了新的多token预测方案,发现在小型模型上,多token预测导更差的结果,但随着模型规模的增加,它变得越来越有用。此外,多token预测还使模型在推理时间上提升了3倍,尤其在 “字节级标记化” 训练上,多字节预测大幅优于基线的单字节预测模型。多token预测仍有改进空间,研究人员正在考虑自动选择最佳预测token数量的技术,以及研究词汇量和多token预测之间的动态关系。
这项研究及其未来的改进对企业应用有用的地方在于,它有可能为生成任务提供更快的推理和更高的准性,几乎不需要额外的成本。同时,它保留了大部分 LLM 架构,可以与 Transformer 块的其他优化技术兼容。
麒麟合盛APUS发布自研千亿级多模态“AiLMe天燕大模型”
9月2日,人工智能企业APUS(麒麟合盛网络技术股份有限公司)公布了自主研发的千亿级多模态人工智能大模型“天燕大模型”,也被称为AiLMe大模型。据APUS介绍,天燕大模型具备对文本、图像、视频、音频的理解和生成能力,并且在国际权威测评C-Eval中取得了整体排名第三的好成绩。站长网2023-09-04 08:56:200001智界S7及华为全场景发布会定档11月28日
华为在今日宣布,将于11月28日举办一场盛大的发布会,主题为“智界S7及华为全场景发布会”。届时,华为的全新车型智界S7将正式上市,预售价为25.8万起,目前已经有超过3万台车预定。智界S7定位于纯电轿跑,车身尺寸为497119631474mm,轴距为2950mm。这款车采用了全新的OneBox造型设计,使得车内空间利用率高达88%。站长网2023-11-22 09:52:580000iQOO 11S发布:充电最快的骁龙8 Gen2旗舰 3799元起
快科技7月4日消息,iQOO11S正式发布。售价方面,iQOO11S12GB256GB售价3799元;16GB256GB售价4099元;15GB512GB售价4399元;16GB1TB售价4799元。对比iQOO11,iQOO11S升级为200W有线闪充,是迄今为止充电速度最快的骁龙8Gen2旗舰手机。站长网2023-07-05 09:17:200001摩根士丹利:受益于人工智能推动 Adobe 股价有望继续上涨 25%
根据摩根士丹利的分析师KeithWeiss的观点,Adobe公司的股价还有望继续上涨,他预计该创意软件制造商的股价将在未来一年内上涨25%。今年,Adobe股价已经上涨了60%以上,受到人工智能战略前景的乐观情绪的推动。Weiss的最新目标价位为660美元,接近其2021年创纪录的688.37美元。站长网2023-08-01 16:32:310000英伟达多元化供应链:人工智能芯片需求激增 部分产品或交由英特尔代工
英特尔有可能成为英伟达未来GPU的制造商。英伟达CEO黄仁勋在Computex的全球媒体圆桌会议的问答环节时表示,公司正在努力多元化其芯片制造,并且最近已经获得了一款基于英特尔下一代工艺节点的测试芯片的良好测试结果。他的这番言论是在多个问题集中讨论英伟达如何确保在人工智能芯片需求激增的情况下供应,并且公司完全依赖位于台积电来制造其最先进的GPU。站长网2023-05-31 09:23:510000