智源开源中英文语义向量模型BGE 支持免费商用
站长网2023-08-07 16:12:130阅
近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding002等。
此外,BGE 保持了同等参数量级模型中的最小向量维度,使用成本更低。
据介绍,中文语义向量综合表征能力评测 C-MTEB 的实验结果显示,BGE中文模型(BGE-zh)在对接大语言模型最常用到的检索能力上领先优势尤为显著,检索精度约为 OpenAI Text Embedding002的1.4倍。
与中文能力相类似,BGE 英文模型(BGE-en)的语义表征能力同样出色。根据英文评测基准 MTEB 的评测结果(Table2),尽管社区中已有不少优秀的基线模型,BGE 依然在总体指标(Average)与检索能力(Retrieval)两个核心维度超越了此前开源的所有同类模型。
同时,BGE 的各项能力都显著超越社区中最为流行的选项:OpenAI Text Embedding002。
BGE 模型链接:
https://huggingface.co/BAAI/
BGE 代码仓库:
https://github.com/FlagOpen/FlagEmbedding
C-MTEB 评测基准链接:
https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark
0000
评论列表
共(0)条相关推荐
阿里巴巴:蚂蚁拟回购约7.6%股份 考虑是否参与
阿里巴巴公告称,蚂蚁集团将召开股东大会,以批准(除其他事项外)蚂蚁集团向其全体股东回购不超过7.6%股份的议案。拟议股份回购价格代表蚂蚁集团估值金额约为5671亿元人民币(约784.8亿美元)。据了解,此次回购的股份将转入蚂蚁集团公司员工激励计划。阿里巴巴集团正在考虑是否参与拟议的股份回购。站长网2023-07-10 15:59:450000黄仁勋预测:每个人都必须学会善用人工智能 这类公司将会消亡
日前,英伟达公司创始人兼首席执行官黄仁勋在台大毕业典礼上发表致辞讲话。他在演讲中指出,人工智能开启了巨大的机遇,灵活的公司将利用人工智能来提升自身地位,同样的,未能充分利用人工智能的公司将会消亡。站长网2023-05-27 14:44:070000小米×徕卡光学研究所正式成立:小米14 Ultra为首个重要成果
小米今日正式宣布,与徕卡携手创建的“小米徕卡光学研究所”已经落成。该研究所汇聚了超过200名行业精英,他们将共同专注于四大技术方向,致力于引领光学技术的革新,并确立全新的光学标准。这四大技术方向涵盖了超精密光学设计、高性能计算摄影、前沿光电技术,以及先进镜头光学标准。通过集结这么多行业内的翘楚,小米和徕卡共同打造的这一研究机构,无疑将为移动影像领域带来革命性的变革。站长网2024-02-19 15:53:350000超20亿次浏览!被央视点名的“贵州村超”,为什么这么火?
前几天,在梅西参加比赛的北京工体门外,一块签满名字的牌匾引发围观:贵州“村超”代表两千公里送真情。自从梅西要来中国的消息传出,就在广大球迷中引发巨大关注,也刮起了一股梅西热潮。这个夏天,在足球界能和梅西抢热度的,除了跳下看台拥抱梅西的年轻小伙子,恐怕只有贵州省榕江县正如火如荼的“村超”了。没想到,一个小小的村与村对抗的足球联赛,竟然被央视点名表扬。站长网2023-06-21 15:13:140008极越全量OCC感知模型即将上线:泊车效率提升 行车逻辑优化
站长之家(ChinaZ.com)2月20日消息:极越汽车CEO夏一平在微博上宣布,极越汽车的全新技术即将上线。作为国内首个全量OCC感知模型,该模型将引领智能驾驶技术的新篇章。据夏一平透露,全新的1.3.1版本将在2月底前全面推送给所有用户。这一版本不仅新增了OCC感知模型,还加入了哔哩哔哩与小宇宙客户端功能,为用户带来更加丰富的车载娱乐体验。站长网2024-02-20 16:36:190000