智源开源中英文语义向量模型BGE 支持免费商用
站长网2023-08-07 16:12:130阅
近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding002等。
此外,BGE 保持了同等参数量级模型中的最小向量维度,使用成本更低。
据介绍,中文语义向量综合表征能力评测 C-MTEB 的实验结果显示,BGE中文模型(BGE-zh)在对接大语言模型最常用到的检索能力上领先优势尤为显著,检索精度约为 OpenAI Text Embedding002的1.4倍。
与中文能力相类似,BGE 英文模型(BGE-en)的语义表征能力同样出色。根据英文评测基准 MTEB 的评测结果(Table2),尽管社区中已有不少优秀的基线模型,BGE 依然在总体指标(Average)与检索能力(Retrieval)两个核心维度超越了此前开源的所有同类模型。
同时,BGE 的各项能力都显著超越社区中最为流行的选项:OpenAI Text Embedding002。
![](https://i.zz5.net/images/article/2023/08/07/161213180.jpg)
BGE 模型链接:
https://huggingface.co/BAAI/
BGE 代码仓库:
https://github.com/FlagOpen/FlagEmbedding
C-MTEB 评测基准链接:
https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark
0000
评论列表
共(0)条相关推荐
闪婚、鸡娃、恶斗儿媳:老年短剧成为流量新贵
最近两个月,不少以老年人为主角的短剧登上热度榜单:《闪婚五十岁》《五旬老太守国门大夏歌神赢爆全场》《金榜题名之母凭子贵》《人到五十,闪婚霸总》……老年人的婚姻、情感以及生活故事,成了当下短剧创作的“新流量密码”。站长网2024-08-10 17:20:330000亿万富翁投资者 David Tepper 将58%的投资组合投入这7只AI股票
###划重点:1.📊**股票组合概况**:DavidTepper的Appaloosa管理基金近58%的投资集中在七只人工智能(AI)股票上,包括MetaPlatforms、Microsoft、Amazon、Nvidia、Alphabet、Alibaba和AdvancedMicroDevices(AMD)。站长网2024-02-04 10:53:140004Stable Diffusion3首批邀请测试资格发放
最新消息,SD3的首批邀请测试资格已经发放,模型权重预计会在下个月发布。官方称会逐步扩大规模,很快将会发放更多测试资格。此前,StabilityAI发布SD3技术报告,披露了SD3更多细节。SD3在排版质量、美学质量和提示词理解方面超越目前所有开源和商业模型。报告介绍了SD3的新多模态扩散Transformer架构MMDiT,改善了系统对文本的理解和拼写能力。站长网2024-03-14 15:26:020001消息称网易起诉暴雪欠款3亿 此前双方表示不再续约合作
据36氪报道,近日,上海网之易网络科技发展有限公司在上海提起诉讼,指控暴雪娱乐有限公司违反了系列许可协议,要求退还3亿欠款。这笔款项包括网之易已全额支付的停服游戏的相关退款、未售游戏商品库存的预付款项以及数款未开发游戏的预付保证金等。站长网2023-04-24 14:41:240000抖音影视剧剪辑,每天能赚好几千
各位村民好,我是村长。每天在抖音、西瓜看电影就能赚钱,而且一天甚至可以赚好几千块钱。当然,这不是用户获得的,而是用户看了以后,发布影视剧作品的作者得到的。相信许多人都在头条、西瓜、抖音上一些电视剧、电影、戏曲、动画片,短的三五分钟、长的十几分钟甚至半个小时以上。这就是影视剧剪辑项目,他们剪辑的内容只要用户看了产生播放量,号主就有收益了。站长网2023-07-27 10:35:340000