Meta 发布新多token预测技术,使AI模型速度提升3倍
划重点:
⭐ 研究人员在 Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的一项研究中提出了通过同时预测多个token来改进 AI 大型语言模型(LLMs)的准确性和速度。
⭐ 多token预测使模型在推理时间上提升了3倍,并在生成任务上表现更佳,特别是对于长期模式的学习。
⭐ 这项研究为企业应用提供了更快的推理速度和更高的准确性,特别适用于生成任务,同时与 Transformer 块的其他优化技术兼容。
近期,Meta、Ecole des Ponts ParisTech 和 Université Paris-Saclay 的研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。这与自回归语言模型的经典结构相悖,后者旨在一次预测一个token。
然而,多token预测并非适用于所有类型的模型和语言任务,但在某些领域中提供了重大优势,推理速度提升了3倍,并在生成任务上表现更佳。虽然仍有改进空间,但这项技术可能成为某些 LLM 应用的强大工具。
传统的训练 LLMs 的方法被称为 “下一个token预测”,这是一种自监督学习技术,模型被给定一个token序列,必须预测下一个token。然后将预测的token添加到输入中,重复这个过程,一次预测一个token。在大量文本语料上重复此过程,模型学习了允许它输出连贯文本段落的一般模式。
研究人员已经研究并记录了下一个token预测在获取语言、世界知识和推理能力方面的局限性。新研究的假设是 “训练语言模型同时预测多个未来token会导致更高的样本效率”。
多token预测指示 LLM 同时预测训练语料库中每个位置的多个来token。研究人员提出了一个简单的多token预测架构,不需要额外的训练时间或内存开销。
他们在多种任务上测试了新的多token预测方案,发现在小型模型上,多token预测导更差的结果,但随着模型规模的增加,它变得越来越有用。此外,多token预测还使模型在推理时间上提升了3倍,尤其在 “字节级标记化” 训练上,多字节预测大幅优于基线的单字节预测模型。多token预测仍有改进空间,研究人员正在考虑自动选择最佳预测token数量的技术,以及研究词汇量和多token预测之间的动态关系。
这项研究及其未来的改进对企业应用有用的地方在于,它有可能为生成任务提供更快的推理和更高的准性,几乎不需要额外的成本。同时,它保留了大部分 LLM 架构,可以与 Transformer 块的其他优化技术兼容。
机器人ChatGPT来了,80亿参数、前OpenAI人员经数年打造
严格地说,是“拾取与放置任务”版本的ChatGPT来了。除了自然语言交流,还能像Sora一样生成视频。有了机器人基础模型RFM-1,使用简单英语就能指导机器人完成拣选工作。机器人AI公司CovariantCEOPeterChen坐在一个聊天机器人面前,界面和ChatGPT的很像。站长网2024-03-13 13:55:000001英格兰法官获准使用ChatGPT进行法律裁决
#划重点1.法官可使用ChatGPT协助书写法律裁决,尽管有人警告AI可能捏造不存在的案例。2.英格兰和威尔士的数千名法官收到司法办公室的官方指导,认为AI可用于总结大量文本或执行行政任务。3.指导警告ChatGPT等聊天机器人在进行研究时效果差,容易虚构案例或法律文本,并提到深度伪造技术可能用于制造虚假证据。站长网2023-12-12 16:29:370002对话漫友CEO赖春晖:AI 来了,漫画家还有未来吗?
能靠画漫画养活自己甚至实现财富自由的人只是凤毛麟角,大部分基层动漫作者仍然面临生存问题。很多动漫从业者自称“画手”,因为他们只负责漫画的线稿、上色、排版等工作。AI技术的应用,将加剧金字塔底的就业危机。各种娱乐形式在争夺用户的注意力和时间,漫画行业的市场环境和消费生态都发生了很大的变化,国内已经很难出现像漫威宇宙、《海贼王》《龙珠》这样量级的国民级漫画。站长网2023-05-04 14:08:260000腾讯游戏发布中秋国庆未成年人限玩通知 累计可游玩8个小时
今日,腾讯游戏发布《2023年中秋及国庆节假期前后未成年人游戏限玩的通知》称,结合国家新闻出版署《关于进一步严格管理切实防止未成年人沉迷网络游戏的通知》与实际放假调休安排,2023年中秋及国庆节假期前后,腾讯游戏旗下在中国大陆地区运营的网络游戏面向未成年人的游戏限玩执行如下:未成年人限玩:9月29日(中秋节假期)9月30日-10月6日(国庆节假期)站长网2023-09-26 16:43:030000KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争
要点:1.CAMEL(骆驼)是KAUST研究团队推出的大模型心智交互框架,以角色扮演为基础,实现AIAgents之间的协作和竞争,被NeurIPS2023录用。2.CAMEL框架具有灵活的模块化功能,支持开发者在多智能体系统、合作人工智能、博弈论模拟、社会分析等方面进行应用开发。作者通过生成两个大型指令数据集和两个单轮问答数据集来探索LLM涌现能力的研究。站长网2023-11-22 16:28:370000