智源开源最强检索排序模型 BGE Re-Ranker v2.0
智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0,支持100 种语言,文本长度更长,并在多项评测中达到了 SOTA(state-of-the-art)的结果。该模型是智源团队在 BGE(BAAI General Embedding)系列基础上的新尝试,扩展了向量模型的 “文本 图片” 混合检索能力。
BGE Re-Ranker v2.0采用分层自蒸馏策略优化推理效率,通过不同尺寸的模型基座(如 MiniCPM-2B、Gemma-2B、BGE-M3-0.5B)支持多语言检索能力。此外,该模型还新增了对 “文本 图片” 混合检索功能的支持,通过引入 CLIP 模型生成的 visual token 实现。
在性能评测方面,BGE Re-Ranker v2.0在英文、中文、多语言主流基准上取得了优秀的检索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等评测基准中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候选集时表现优异,提升了检索精度。同时,模型在 RAG 场景下也能够显著提升各种 embedding 模型的召回结果,配合 BGE-M3可以获得最佳的端到端检索质量。
BGE 系列模型的优秀性能和通用性也受到了社区的广泛关注,Vespa、Milvus 等主流向量数据库框架已经集成了 BGE-M3模型,为用户搭建 “三位一体” 的检索流水线提供了便利。
综上所述,智源研究院推出的 BGE Re-Ranker v2.0检索排序模型具有强大的多语言支持、更长文本长度、优秀的检索效果和灵活的 “文本 图片” 混合检索功能,为信息检索领域带来了新的利器。
项目地址:
https://github.com/FlagOpen/FlagEmbedding
https://huggingface.co/BAAI
谷歌AI与机器人联手打造新材料
**划重点:**1.🌐谷歌DeepMind的AI系统GNoME预测了近40万种稳定物质,而A-Lab自主系统学会在实验室中制造这些物质。2.⚙️GNoME通过仿真计算提出了220万种潜在化合物,A-Lab则使用最新的机器人技术在18天内制备出41种新型无机材料,其中9种是通过主动学习改进合成过程而获得的。站长网2023-12-01 16:04:2700002024福布斯中国杰出商界女性:孟晚舟跃居第二
《福布斯中国杰出商界女性100》是福布斯中国每年发布的榜单,旨在关注女性在商业领域的表现。今年榜单着重关注女性在商业竞争中的角色转换和认知,展示女性领导者的独特魅力与智慧。今年上榜者平均年龄51岁,包括创业者、职业经理人和女性二代接班人。覆盖行业包括科技、大消费等。在职业背景方面,44%的上榜者是白手起家的创业者或早期加入创始团队的成员,44%是职业经理人,而12%则是女性二代接班人。站长网2024-03-08 10:37:41000050天涨粉1277万,带货近13亿元,董宇辉清空微博还重要吗?
董宇辉又双叒上热搜了,这次是因为清空微博。2月27日上午,董宇辉突然清空个人微博账号的内容,并在当晚的直播中解释说这是他的“匹夫之怒”,“我知道我这么做没用,但是我只是这么做了”。此前,因为在直播时拒绝讲解女士内衣内裤,董宇辉被部分网友吐槽没有职业操守,“不能讲你不要上架这个商品啊”。其实按照业内相关规定,女性用品最好由女主播来讲解。此前李佳琦带货女士内裤时,也是由女助播来完成产品介绍工作。站长网2024-02-29 18:15:580000京东第一季度营收2600亿元 京点点已帮助7万商家降低成本
5月16日,京东集团发布了2024年一季度业绩,收入和净利润双超市场预期。一季度,京东集团收入达到2,600亿元人民币(约360亿美元),同比增长7.0%,增速进一步提升。服务收入达到515亿元人民币(约71亿美元),同比增长8.8%,其中,物流及其他服务收入同比增长13.8%,继续保持强劲增长势头。站长网2024-05-17 08:26:150000pgvecto.rs:提供矢量相似性搜索的Postgres扩展
pgvecto.rs是一个Postgres扩展,提供矢量相似性搜索功能。它易于使用,并可以集成到现有的工作流程和应用程序中。pgvecto.rs是用Rust编写的,因此与类似产品相比,它具有更好的内存安全性、更好的性能和降低的维护成本。pgvecto.rs的目标是提供易于使用、高性能、安全的向量数据库解决方案。核心功能:站长网2023-08-19 15:30:540003