微软公布辅助模型 ICAE 可进行高效的上下文压缩
站长网2023-07-19 12:29:520阅
根据Arxiv平台发布的信息,微软公司近期公开了一项关于In-context Autoencoder(ICAE)模型的研究论文。这款模型的应用领域是大型语言模型(LLM),主要目的在于进行高效的上下文压缩。
遗式透露,ICAE模型实际上包括两个主要模块。一个是可学习的编码器,其通过对LLM进行LoRA(Long Range Arena)策略进行采用、调整,具备了将长篇幅的上下文压缩至有限数量的存储槽的能力。另一个模块则是一个固定的解码器,而这个解码器能够根据存储槽中已经压缩的上下文信息,进行适当的条件选择以达成各种目标。
实验结果显示,ICAE模型可以有效地生成具有4倍上下文压缩能力的存储槽,并且其固定解码器能够非常好地对存储槽中的信息进行条件选择,从而帮助模型产生恰当的响应。
这表明,利用ICAE的特性,可以有效降低语言模型处理复杂上下文信息时的计算负担,从而提高模型的性能和效率。这也再次证明了微软公司在人工智能和自然语言处理领域的领先地位。
0000
评论列表
共(0)条相关推荐
在朋友圈刷“直播”,电商引流又增新玩法
对于广大网友来说,每天打开手机,刷刷短视频,浏览朋友圈,成为了一天中放松的小休闲。尤其是微信生态,承载了用户各种各样的需求。腾讯2023Q3财报显示,微信月活跃用户数突破13亿,小程序交易额增加40%,视频号总播放量增加50%,搜一搜月活跃用户量也突破8亿。数据基础,令人叹服。在微信生态各商业触点有机协同之下,朋友圈引流又增加了新玩法。站长网2024-01-16 14:33:440000电商MCN的上市之路,走到哪一步了
7月11号,港股世纪睿科正式更名为“交个朋友”。早在今年5月,世纪睿科就曾发布公告,宣布已完成对交个朋友公司的全资收购,拥有其旗下的核心资产。此次改名,则意味着交个朋友正式完成了“子吞母”,顺利以其本名在港股上市。站长网2023-07-16 05:52:300000工信部:加快大数据、人工智能等战略性新兴产业创新发展
7月4日,2023全球数字经济大会在北京开幕。工信部公布数据称,截至今年5月底,我国累计建成5G基站达284.4万个,蜂窝物联网终端用户超20.5亿户,IPv6地址资源总量位居全球第一,算力基础设施达到世界领先水平。\工信部表示,将加快新型基础设施建设,促进数字基础设施体系化发展和规模化部署,加快建设高速泛在、天地一体、云网融合、智能敏捷、绿色低碳、安全可控的智能化综合性数字信息基础设施。站长网2023-07-05 19:09:030001在618“安静”的背后,是本地零售的崛起
今年618可能是有史以来最“安静”的一个电商购物节,安静到可能很多人都没有意识到它发生过。迄今为止,没有一家主流电商平台公布了整体GMV增速——从“传统的”阿里、京东,到近年来新兴的抖音、快手皆是如此,大家最多只公布了几个表现较好的品类增速而已。无论在社交媒体上,还是在我本人周围,618购物节的讨论热度都非常低;我自己甚至就算买东西比较多的了。0000手机的生成式AI,可能是传统软件企业的最后机会
众所周知,如今在智能手机行业中,“生成式AI”已然成为了最为知名的卖点之一。不管是什么价位段的智能手机,现在通常都会宣传自己集成了“生成式AI”功能。它们有的表现为能与用户自然、流畅对话,生成各种建议的“语音智能体”,有的则表现为能自动帮用户总结文章、剪辑文字,或是将照片自动拼接为视频的“创作助手”。站长网2024-05-06 11:04:120000