智源开源中英文语义向量模型BGE 支持免费商用
站长网2023-08-07 16:12:130阅
近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding002等。
此外,BGE 保持了同等参数量级模型中的最小向量维度,使用成本更低。
据介绍,中文语义向量综合表征能力评测 C-MTEB 的实验结果显示,BGE中文模型(BGE-zh)在对接大语言模型最常用到的检索能力上领先优势尤为显著,检索精度约为 OpenAI Text Embedding002的1.4倍。
与中文能力相类似,BGE 英文模型(BGE-en)的语义表征能力同样出色。根据英文评测基准 MTEB 的评测结果(Table2),尽管社区中已有不少优秀的基线模型,BGE 依然在总体指标(Average)与检索能力(Retrieval)两个核心维度超越了此前开源的所有同类模型。
同时,BGE 的各项能力都显著超越社区中最为流行的选项:OpenAI Text Embedding002。
BGE 模型链接:
https://huggingface.co/BAAI/
BGE 代码仓库:
https://github.com/FlagOpen/FlagEmbedding
C-MTEB 评测基准链接:
https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark
0000
评论列表
共(0)条相关推荐
董明珠曾怼职场拍马屁:不喜欢员工在面前说好听的话
近日,格力电器的年会上一则快板节目引发了广泛关注。在年会上,快板节目《大格“局新魅力”》中的一句话:“论关系,我比你们都特殊,我妈就是董明珠。”迅速成为网络热议的话题。对此,格力电器官方回应称,表演者是为了增加幽默气氛而开的玩笑。据报道,该节目是由外部人员编排的,而王自如则是活动的策划总指挥。站长网2024-02-02 14:23:250000ChatGPT 落入大学生之手,6 个月后实现月收入 45 万元,代价:挂科两门!
ChatGPT浪潮来袭,大厂们正在紧锣密鼓地研发大模型,创业公司在垂直生态之下发力内容制作、工具等应用,不少一线开发者、爱好者则利用AI在提升工作效率之余也做起了兼职与副业生意。对此,也有一个名为MillionDollarAI的网站做了一个聚合页分享了这些基于已有AI模型而拓展研发的一些产品,其中有些现如今收益颇丰,令人生羡。站长网2023-05-25 18:15:490000岐黄问道大模型发布 年轻人养生的第一个大模型
近日,国内医疗大模型“岐黄问道大模型”发布,该模型以中医为核心,旨在实现临床诊疗和养生调理的智能化。该模型具有三个子模型:基于已确诊疾病的临床诊疗大模型、基于症状和体征的临床诊疗大模型以及中医养生调理大模型。其中,中医养生调理大模型可以根据输入的症状和体征信息,给出多维度的养生方案,包括中药、经络穴位、食疗等。该模型的训练过程也在发布会上公开展示,采用四层递进的训练方式。站长网2023-08-01 14:03:370000AI视野:DALL·E3模型向ChatGPT开放;Midjourney发布图像放大功能;百家号内测“AI助手”;vivo将在新手机系统搭载大模型
🤖📈💻💡大模型动态DALL·E3模型已向ChatGPTPlus和企业版用户开放今日,OpenAI官方宣布,DALL·E3现已向所有ChatGPTPlus和企业版用户开放。DALL·E3是OpenAI研发的最强大的图像生成模型。它通过训练先进的图像字幕生成器,然后让DALL·E3在生成图像时关注用户提供的提示,从而能够可靠地渲染复杂细节和响应各种宽高比的提示。站长网2023-10-20 15:25:030000美政府对AI不放心 OpenAI CEO将首次赴国会作证
凤凰网科技讯《AI前哨》北京时间5月11日消息,OpenAICEO萨姆·阿尔特曼(SamAltman)将于下周出席美国参议院的一个小组委员会听证会,这将是他首次在美国国会作证。随着人工智能(AI)技术变得越来越强大和普及,美国国会正在努力解决如何以最好方式监管AI。0001