智源开源最强检索排序模型 BGE Re-Ranker v2.0
智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0,支持100 种语言,文本长度更长,并在多项评测中达到了 SOTA(state-of-the-art)的结果。该模型是智源团队在 BGE(BAAI General Embedding)系列基础上的新尝试,扩展了向量模型的 “文本 图片” 混合检索能力。
BGE Re-Ranker v2.0采用分层自蒸馏策略优化推理效率,通过不同尺寸的模型基座(如 MiniCPM-2B、Gemma-2B、BGE-M3-0.5B)支持多语言检索能力。此外,该模型还新增了对 “文本 图片” 混合检索功能的支持,通过引入 CLIP 模型生成的 visual token 实现。

在性能评测方面,BGE Re-Ranker v2.0在英文、中文、多语言主流基准上取得了优秀的检索效果。例如,在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等评测基准中,BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候选集时表现优异,提升了检索精度。同时,模型在 RAG 场景下也能够显著提升各种 embedding 模型的召回结果,配合 BGE-M3可以获得最佳的端到端检索质量。
BGE 系列模型的优秀性能和通用性也受到了社区的广泛关注,Vespa、Milvus 等主流向量数据库框架已经集成了 BGE-M3模型,为用户搭建 “三位一体” 的检索流水线提供了便利。
综上所述,智源研究院推出的 BGE Re-Ranker v2.0检索排序模型具有强大的多语言支持、更长文本长度、优秀的检索效果和灵活的 “文本 图片” 混合检索功能,为信息检索领域带来了新的利器。
项目地址:
https://github.com/FlagOpen/FlagEmbedding
https://huggingface.co/BAAI
美国国土安全部成立工作组 用AI保障国家安全
国土安全部将成立一个新的工作组来研究政府如何使用人工智能技术来保障国家安全。国土安全部部长亚历杭德罗·马约卡斯(AlejandroMayorkas)说道,“工作组将带头负责任地使用AI来保护国土安全,同时还承诺防止恶意使用这种变革性技术”。国土安全部将成立人工智能工作组以研究推出AI技术在国家安全领域的使用方案,并希望用AI技术来保障贸易安全并打击毒品犯罪。站长网2023-04-23 17:53:330001抖音电商推出商家扶持计划:加大算法研发投入 升级流量机制
抖音电商今日宣布推出其历史上规模最大的商家扶持计划,详细公布了九大扶持举措。这些措施旨在帮助商家降低成本、提升经营体验,并解决退货、价格战、广告投放等问题。具体措施包括免除佣金、退单推广费返还、降低运费险和保证金等成本控制措施。0000阿里AI职业趋势报告:AI能力正在成为职场关键竞争力
“五一”劳动节前夕,阿里巴巴发布了一份《“AI”职业趋势报告》,详细解读了我国各行各业如何运用人工智能(AI)推动职业发展。报告明确指出,AI在编程、设计、乃至养猪等多个领域都展现出强大的应用价值,预示着“人人都有一个AI助理”的时代正加速到来。在这样的背景下,AI能力正逐渐成为职场的核心竞争力,而“人机协作”则成为新的工作常态。站长网2024-04-26 04:10:510000私域近九成留存率,千万用户大盘如何从“量变”到“质变”?
乘着一波大势,这家企业在全国快速增长了数千家门店,但随之而来也有大量连锁门店管理难题。存量市场当下,新渠道增长与拓展是企业的主要思考点之一,但相比之下,后端全渠道管理是比拓展新渠道更难。前不久,见实会员一行走进这家连锁门店企业展开游学活动。集团会员负责人杨鑫提到,高质量门店流量,为他们带来留存率高达85%以上的千万私域用户。这背后的两个重要体感:站长网2024-02-04 10:58:140000贾跃亭回应FF起诉高合汽车:盗窃FF的知识产权
今日,法拉第未来(FaradayFuture,简称FF)的创始人贾跃亭在微博上发文,宣布经过长期调查取证和准备,FF已正式对丁磊和高合汽车提起诉讼,指控其涉嫌盗窃和侵犯FF的知识产权、技术数据和商业机密。站长网2024-03-05 15:01:400000