蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存
站长网2023-11-06 16:29:240阅
蚂蚁集团旗下CodeFuse 代码大模型宣布开源了 ModelCache 大模型语义缓存,可以降低大型模型应用的推理成本,提升用户体验。
ModelCache 的架构包括 adapter、embedding、similarity 和 data_manager 模块。adapter 模块处理业务逻辑,embedding 模块将文本转换为语义向量表示,similarity 模块对向量进行相似度排序和评估,data_manager 模块负责数据的存储和查询。ModelCache 还支持一键清空和缓存淘汰策略等缓存数据管理功能,数据隔离功能以确保不同环境、产品和模型之间的数据独立性,以及数据回流功能来保存重要数据。

ModelCache 的线上效果统计表明,命中缓存可以将平均耗时降低10倍,提速率可达14.5%。此外,ModelCache 还对 embedding 模型进行了持续优化,以提高语义相似度的准确性。
未来,ModelCache 将继续优化性能和精度,通过算法优化、数据存取和计算资源调配等手段提升召回时间和准确率。同时,将进一步改进语义表示技术和相似度评估模块,以提高模型对复杂语义的理解能力和召回率。
CodeFuse-ModelCache 项目地址:
https://github.com/codefuse-ai/CodeFuse-ModelCache
0000
评论列表
共(0)条相关推荐
抖音打击侵害人身安全言行行为 11月处置不当言论账号9342个
抖音发布《关于打击侵害人身安全言行的公告》称,严厉打击实施或教唆、鼓动他人实施“网暴”的行为,严禁实施对他人造成伤害的行为,同时,平台呼吁共同关注与保护未成年人与老年人权益,持续打击、处置违规账号。抖音称,2023年11月,平台在日常巡查中发现:0001配备苹果自研 5G 基带的新款 iPhone SE 预计推迟到 2025 年发布
据分析师JeffPu称,苹果计划在2025年发布一款配备定制设计的5G调制解调器(基带芯片)的iPhoneSE。他在周二于海通国际证券的一份研究报告中说,该调制解调器将由苹果的芯片制造伙伴台积电制造。站长网2023-04-13 10:49:2600002023 年时尚界 7 大值得关注的人工智能创新
当我们看到世界各地的公司纷纷在日常工作流程中实施生成式人工智能的潮流时,时尚行业也在用各种方式应用AI。特别是在2023年的最后六个月。人工智能一直是分析趋势驱动系列数据的催化剂,并且在开发环保材料、优化生产以实现可持续发展和更多的。现在,让我们来探讨一下今年人工智能在时尚行业应用的一些关键进展。图源备注:图片由AI生成,图片授权服务商MidjourneyMeta0000滴滴发布2023年五一假期出行安全公告 成立大安全委员会
滴滴出行发布2023年五一假期出行安全公告,宣布升级成立大安全委员会,下设交通与生产安全、信息与数据安全、活动运营安全、合规发展安全、组织建设与员工发展安全、国际发展安全等六个专项安委会。按照大安委部署要求,五一假期及前后,各专项安委会负责人将协同业务负责人、区域负责人、客服团队、应急处置团队,实行24小时轮岗值班制度,全时待命,确保遇到各类紧急情况时切实做到高效响应、妥善解决。站长网2023-05-12 20:26:550001马斯克:传统油车将迎“柯达时刻” 不转型电动车会像“胶卷”一样被淘汰
快科技8月23日消息,日前,马斯克警告称,传统汽车制造商即将迎来他们的柯达时刻”,如果他们不能加快向电动汽车转型的步伐。就像曾经的胶片行业巨头柯达一样,因为赶不上数字时代的潮流而被淘汰。一位X用户发帖称:传统汽车即将迎来他们的柯达时刻。”马斯克回应称:不幸的是,对许多汽车制造商来说,这是一种趋势。一些公司确实明白这一点,但它们的变革步伐仍然缓慢。”站长网2023-08-24 11:44:050000