微软公布辅助模型 ICAE 可进行高效的上下文压缩
站长网2023-07-19 12:29:520阅
根据Arxiv平台发布的信息,微软公司近期公开了一项关于In-context Autoencoder(ICAE)模型的研究论文。这款模型的应用领域是大型语言模型(LLM),主要目的在于进行高效的上下文压缩。
遗式透露,ICAE模型实际上包括两个主要模块。一个是可学习的编码器,其通过对LLM进行LoRA(Long Range Arena)策略进行采用、调整,具备了将长篇幅的上下文压缩至有限数量的存储槽的能力。另一个模块则是一个固定的解码器,而这个解码器能够根据存储槽中已经压缩的上下文信息,进行适当的条件选择以达成各种目标。
实验结果显示,ICAE模型可以有效地生成具有4倍上下文压缩能力的存储槽,并且其固定解码器能够非常好地对存储槽中的信息进行条件选择,从而帮助模型产生恰当的响应。
这表明,利用ICAE的特性,可以有效降低语言模型处理复杂上下文信息时的计算负担,从而提高模型的性能和效率。这也再次证明了微软公司在人工智能和自然语言处理领域的领先地位。
0000
评论列表
共(0)条相关推荐
微软画图或将引入AI画图功能,支持文本转图像
据WindowsCentral报道,微软可能会在Windows11上的微软画图中引入基于AI的新功能,其中包括支持用户通过文本描述生成图片的能力。消息人士告诉WindowsCentral,AI功能将由Bing的ImageCreator背后的相同技术提供支持,该工具可以根据您的描述生成图像。您可以在WindowsCentral发布的内部模型中看到集成的外观。站长网2023-08-23 12:45:320000剪映AI创作平台Dreamina将上线视频生成能力 附内测邀请入口
划重点:1.🌟创作多样:Dreamina平台提供丰富的创作元素,涵盖建筑设计、摄影、插画等多个领域。2.🌐Dreamina即将上线视频生成能力,邀请创作者优先参于到产品上线的内测之中。3.🎨立即生成:简单的文案,立即生成精彩的图片,让创作变得轻松而有趣。Dreamina是剪映旗下AI创作平台,用户可以根据文本内容生成由AI生成的创意图,支持修整图片大小比例和模板类型。站长网2024-02-27 18:18:430003网友激动坏了?上海迪士尼辟谣乐园将落户武汉:假消息 完全不会去
6月3日,有消息称,迪士尼要在武汉落户,现在来看,完全假消息。上海迪士尼度假区公共事务与传讯副总裁MurrayKing(王凯)回复:这是假新闻。上海迪士尼官方客服也公开表示:这是假消息,我们已经辟谣了,不会去武汉建迪士尼。”站长网2023-06-03 19:04:270002实现4G、5G信号显著增强!工信部等开展“信号升格”专项行动
工业和信息化部等十一部门联合宣布启动“信号升格”专项行动,旨在显著增强移动网络(4G和5G)的信号覆盖和质量。这一行动计划将大幅改善移动用户的业务感知,提升网络的整体性能。根据介绍,该行动计划在2024年底前完成超过8万个重点场所的移动网络深度覆盖,覆盖2.5万公里铁路和35万公里公路以及150条地铁线路。0000最强“全开源”多模态分割一切大模型APE
要点:1、APE是一种全开源的多模态分割模型,通过独立建模每个类别名实例、压缩Word-LevelEmbeddings为Sentence-LevelEmbeddings、采用不同的特征融合方式以及统一前景和背景粒度来提高分割效果。站长网2023-12-10 10:13:430001