北京大学发布EAGLE 大模型推理效率无损提升3倍
要点:
EAGLE由滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布,将大模型推理效率提升3倍。
EAGLE采用外推大语言模型的第二顶层特征向量的方法,相较于普通自回归解码,其推理速度提升明显,比普通自回归解码快3倍,比Lookahead解码快2倍,比Medusa解码快1.6倍。
EAGLE使用投机采样方法,通过轻量级的自回归头和冻结的分类头相结合,利用大语言模型提取的上下文特征进行外推,从而更高效地生成文本。
近年来,大语言模型在各领域应用广泛,但其文本生成过程昂贵且缓慢。为解决这一问题,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布了EAGLE。EAGLE的目标是提升大语言模型的推理速度,同时确保输出文本的分布一致性。通过外推大语言模型的第二顶层特征向量,EAGLE成功实现了大模型推理效率的无损提升,比普通自回归解码快3倍,比Lookahead解码快2倍,比Medusa解码快1.6倍。
代码地址:https://github.com/SafeAILab/EAGLE
为了加速自回归解码,EAGLE采用了投机采样方法,使用一个轻量级的自回归头和冻结的分类头相结合。与传统投机采样方法不同,EAGLE的输入包括了抽样结果的词嵌入,使得输入和输出之间更具一致性。这种创新的方法有效地处理了抽样过程中的随机性,提高了生成文本的准确性。
EAGLE的工作原理基于特征向量的可压缩性,通过训练一个轻量级插件,即自回归头,从原始模型的第二顶层预测下一个特征,然后使用原始LLM的冻结分类头预测下一个词。这种外推特征向量的方法使得EAGLE在生成文本的同时保持了与普通解码一致的分布。
总体而言,EAGLE的发布标志着大语言模型推理效率的重大突破,为大规模文本生成任务提供了更加高效的解决方案,将在各领域推动语言模型的应用和发展。
京东采销等一线员工涨薪近100%:欢迎回家 回家即加薪
据微信公众号“京东黑板报”报道,京东集团近日发布采销召集令,宣布自2024年1月1日起,在岗的京东采销等一线业务人员的年固定薪酬将大幅上涨近100%。这一消息的发布旨在欢迎采销兄弟回家,并确保回家后福利司龄继续累计。除了大幅加薪,京东还为采销人员提供了多项福利保障,包括司龄补贴、住房保障基金、继续教育、老员工专属称号以及员工救助基金等都将得到延续。0000做情感咨询,闷声赚大钱!
各位村民好,我是村长很多人让我分享#情感咨询这个赛道,都说这个赛道老赚钱了。事实上也是如此,尽管前几年情感PUA被闹得沸沸扬扬,但是用户对于情感咨询的需求是一直存在的。而且动辄客单价就奔着两三万、四五万去了。那么今天村长就简单和大家一起聊聊,情感咨询这个赛道是怎么做流量、怎么变现的。01源于实际生活的需求一部分朋友会比较好奇,到底是哪些人,哪些场景中,需要情感咨询的介入。0001调查:全球CEO因生成式AI的不确定性部署“受阻”
🔍划重点:1.EY调查显示全球CEO在生成式AI的炒作中感到困惑。2.美国CEO面临部署生成式AI的压力,但不确定性使他们陷入“两难”境地。3.超过三分之二的CEO承认需要迅速采取生成式AI行动,但同样比例的人表示他们被技术的不确定性所“阻碍”。站长网2023-11-01 12:10:370000真车圈海底捞!蔚来驾享服务上新:可上门理发
快科技1月19日消息,作为车圈中的海底捞”,蔚来为车主提供的专属服务让不少其它品牌的车主羡慕,尤其是驾享服务”。而日前,博主分享的截图显示,蔚来驾享服务增加了新的项目上门理发”,服务时间为1月29日-2月4日的春节假期。蔚来此举是考虑到了春节假期期间,街上理发店关门回家过节后,理发无法满足的需求。据其介绍,下单后蔚来专员会携带理发工具上门,提供修剪服务,暂时没法烫染,价格与驾享计费规则一致。0001高通激进!骁龙8 Gen4定版:超大核飙至4.32GHz 远高于A18 Pro
快科技9月11日消息,数码闲聊站爆料,高通骁龙8Gen4的两颗超大核频率最终敲定为4.32GHz,6颗大核的频率最终锁定为3.53GHz,对比上代的3.3GHz提升巨大,同时高于苹果A18Pro的4.04GHz。根据Geekbench公布的跑分数据,骁龙8Gen4的单核成绩是3236,多核成绩是10049,作为对比,A18Pro单核成绩是3018,多核成绩是7751。站长网2024-09-12 03:53:010000