Meta 发布新多token预测技术,使AI模型速度提升3倍
划重点:
⭐ 研究人员在 Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的一项研究中提出了通过同时预测多个token来改进 AI 大型语言模型(LLMs)的准确性和速度。
⭐ 多token预测使模型在推理时间上提升了3倍,并在生成任务上表现更佳,特别是对于长期模式的学习。
⭐ 这项研究为企业应用提供了更快的推理速度和更高的准确性,特别适用于生成任务,同时与 Transformer 块的其他优化技术兼容。
近期,Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。这与自回归语言模型的经典结构相悖,后者旨在一次预测一个token。
然而,多token预测并非适用于所有类型的模型和语言任务,但在某些领域中提供了重大优势,推理速度提升了3倍,并在生成任务上表现更佳。虽然仍有改进空间,但这项技术可能成为某些 LLM 应用的强大工具。
传统的训练 LLMs 的方法被称为 “下一个token预测”,这是一种自监督学习技术,模型被给定一个token序列,必须预测下一个token。然后将预测的token添加到输入中,重复这个过程,一次预测一个token。在大量文本语料上重复此过程,模型学习了允许它输出连贯文本段落的一般模式。
研究人员已经研究并记录了下一个token预测在获取语言、世界知识和推理能力方面的局限性。新研究的假设是 “训练语言模型同时预测多个未来token会导致更高的样本效率”。
多token预测指示 LLM 同时预测训练语料库中每个位置的多个来token。研究人员提出了一个简单的多token预测架构,不需要额外的训练时间或内存开销。
他们在多种任务上测试了新的多token预测方案,发现在小型模型上,多token预测导更差的结果,但随着模型规模的增加,它变得越来越有用。此外,多token预测还使模型在推理时间上提升了3倍,尤其在 “字节级标记化” 训练上,多字节预测大幅优于基线的单字节预测模型。多token预测仍有改进空间,研究人员正在考虑自动选择最佳预测token数量的技术,以及研究词汇量和多token预测之间的动态关系。
这项研究及其未来的改进对企业应用有用的地方在于,它有可能为生成任务提供更快的推理和更高的准性,几乎不需要额外的成本。同时,它保留了大部分 LLM 架构,可以与 Transformer 块的其他优化技术兼容。
实时AI,最难躺平的战场
有人预测2024将是视频之年,其实今年已经看出端倪。年终将至,图像、视频生成战场仍然高潮迭起。前阵子上线的PikaLabs1.0炸了一波,Meta又推出一个免费的AI图像生成器,口碑不错。谷歌DeepMind最新文生图模型Imagen2毫无悬念地登上了今天的头条。如果有内测资格,你会发现谷歌搜索居然可以直接生图。进入谷歌实验室,测试中的谷歌搜索可以直接生图了。站长网2023-12-15 09:33:230002抖音入局跨境电商,剑指京东阿里?
抖音下场又开始玩跨境电商了!8月14日,抖音APP内上线了一家新店——全球优选进口超市。这是抖音电商旗下的一家以自营类型为主的跨境电商店铺。站长网2023-08-28 18:10:550000张一鸣花90亿为马化腾试错
图源备注:图片由AI生成,图片授权服务商Midjourney在张一鸣下达PICO裁员指令后,马化腾的VR梦也有了新进展。据外媒近日爆料,腾讯与Meta已达成初步协议,腾讯将成为MetaVR头显在中国的独家销售商,正式开售时间定于2024年底。对此消息,截至发稿,腾讯暂未回应。站长网2023-11-12 10:41:070000刘慈欣谈DeepSeek:完全有可能替代科幻小说作家
快科技3月30日消息,日前,2025中国科幻大会在北京举办,主题为科学梦想创造未来”。在大会论坛上,科幻作家刘慈欣谈到了DeepSeek对科幻文学的驱动和发展。据央视财经报道,对于DeepSeek未来是否有可能替代科幻作家的问题,刘慈欣表示,暂时不太会,但是再过10年、20年,从理论上说完全可能代替科幻小说作家。他认为,从科学的角度去讲,所有人类作家的身上没有什么是不可被AI所替代的。0001人工智能初创公司 Cohere 首席执行官批评有效利他主义运动「自以为是」
据彭博社周三报道,人工智能(AI)初创公司Cohere的首席执行官AidanGomez在一封致员工的信中对有效利他主义运动提出批评。Gomez反对他所认为的该运动的「自以为是」,并警告说这种思维可能导致极端行为。彭博社报道称,一位Cohere发言人确认了信件的真实性,但拒绝进一步置评。站长网2023-11-23 08:54:490000