蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存
站长网2023-11-06 16:29:240阅
蚂蚁集团旗下CodeFuse 代码大模型宣布开源了 ModelCache 大模型语义缓存,可以降低大型模型应用的推理成本,提升用户体验。
ModelCache 的架构包括 adapter、embedding、similarity 和 data_manager 模块。adapter 模块处理业务逻辑,embedding 模块将文本转换为语义向量表示,similarity 模块对向量进行相似度排序和评估,data_manager 模块负责数据的存储和查询。ModelCache 还支持一键清空和缓存淘汰策略等缓存数据管理功能,数据隔离功能以确保不同环境、产品和模型之间的数据独立性,以及数据回流功能来保存重要数据。
ModelCache 的线上效果统计表明,命中缓存可以将平均耗时降低10倍,提速率可达14.5%。此外,ModelCache 还对 embedding 模型进行了持续优化,以提高语义相似度的准确性。
未来,ModelCache 将继续优化性能和精度,通过算法优化、数据存取和计算资源调配等手段提升召回时间和准确率。同时,将进一步改进语义表示技术和相似度评估模块,以提高模型对复杂语义的理解能力和召回率。
CodeFuse-ModelCache 项目地址:
https://github.com/codefuse-ai/CodeFuse-ModelCache
0000
评论列表
共(0)条相关推荐
东方甄选入驻拼多多,出抖计划再进一步
东方甄选的抖音出逃计划,又有新动作了。最近,东方甄选悄悄入驻了拼多多。比起之前入驻淘宝时,大张旗鼓地联合宣传,这一次,东方甄选看上去格外低调,可以说是不动声色。如果说,之前出抖入淘,东方甄选还有种跟抖音明面叫嚣的意味在,现在它的种种动作,更像在以一种平常心稳步推进。站长网2024-03-15 09:17:390000奇域AI:符合中国宝宝审美的AI绘画平台
奇域AI是一个表达中式审美的AI绘画创作社区,像Midjourney、SD等比较没办法很好地描绘出来的国画等符合中式审美的绘画风格,在这个平台就可以比较轻松地实现。小编随意写了几个词,可以看出,画作已经很有中式水墨画的意境了。内测地址:qiyuai.net站长网2023-12-21 14:48:530008张朝阳称长期被动刷手机人就废了:要多读书、运动
快科技12月3日消息,如今的智能手机早已不再是一个简单的通讯工具,拿着一部手机几乎就能走遍天下,手机中五花八门的娱乐App也让很多人开始沉迷”手机。据国内媒体报道,《张朝阳的物理课》高校专场系列西安站近日在西安交通大学开讲,搜狐创始人张朝阳回答了许多学生的提问。同时,张朝阳还呼吁大家避免长期被动刷手机,被动投喂接受信息是在消磨时光,形成拖延,然后也不思考了,也不问问题了,那就人就废掉了。0000有人涨粉至千万,有人悄悄落寞,B站百大UP主逐渐两极分化
在卷到飞起的美食赛道,创作者为了获取用户的关注,用各式各样的内容吸引用户的注意力,吃播、探店Vlog、美食制作教程、美食测评等内容形式层出不穷。同时为了保持自身的热度,不少创作者维持着较高的更新频率,甚至有的UP主能做到日更。站长网2023-07-24 17:15:300000抖音治理违规影视剧二创内容 处置违规账号217个
抖音发布《关于违规影视剧二创内容的治理公告》称,为持续营造风清气正的网络环境、维护平台良好的社区秩序,抖音对于平台上发现的违规影视剧二创内容进行了严格治理。最近一周内,平台共清理相关违规内容3929条,处置违规账号217个。站长网2023-05-17 09:18:260000