首页站长资讯Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型

Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型

站长网2023-11-02 15:17:401阅

Jina AI 公布了其第二代文本嵌入模型的最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K（8192个token）上下文长度的开源解决方案。这一成就使其在功能和在大规模文本嵌入基准 (MTEB) 排行榜上的性能方面与 OpenAI 的专有模型 text-embedding-ada-002相当。

Jina-embeddings-v2是开源文本嵌入模型的一大步，在容量和基准性能方面可与已建立的专有对应物相媲美。它的性能优于 OpenAI 的8K 模型 jina-embeddings-v2。值得注意的是，与 OpenAI 相比，Jina-embedding-v2在分类平均值、重新排名平均值、检索平均值和摘要平均值等关键指标上表现出更出色的性能。

研究人员表示，Jina-embeddings-v2以其先进的功能彻底改变了各种应用程序。在法律文件分析中，它捕捉和分析大量法律文本中的每一个错综复杂的细节。对于医学研究，它嵌入了科学论文，促进了整体分析并促进了突破性的发现。该模型深入研究文学分析中的长篇内容，捕捉主题元素以进行更丰富的理解。财务预测使用户能够从详细的财务报告中获得卓越的洞察力，从而增强决策过程。在对话式 AI 中，Jina Embeddings V2显著改善了聊天机器人对复杂用户查询的响应。凭借其多功能和强大的功能，Jina Embeddings V2站在改变我们处理各个领域复杂数据集和从中获取见解的方式的最前沿。

测试表明，这种支持上下文的 jina-embeddings-v2优于其他领先的基础嵌入模型，强调了更长上下文功能的实际优势。

研究人员表示，他们计划发表一篇学术论文，详细介绍Jina-embeddings-v2的技术复杂性和基准，为AI社区提供更深入地探索该模型能力的机会。该团队正在开发一个类似于 OpenAI 的嵌入 API 平台，该平台已进入高级阶段，可确保用户根据他们的需求量身定制的嵌入模型的无缝可扩展性。此外，Jina AI正在通过涉足多语言嵌入来扩大其语言能力，并打算引入德语-英语模型。此次扩张旨在增强他们的产品组合，并巩固他们作为人工智能创新领导者的地位。

该模型可以在 Hugging Face 上轻松免费下载。基础模型专为需要高精度的苛刻任务而制定，适用于学术研究或商业分析等领域。相比之下，小型型号的体积仅为0.07G，专为轻量级任务而设计，非常适合计算资源有限的移动应用程序或设备上的应用程序。认识到人工智能社区的不同需求，Jina AI提出了这两种不同的模型选项，允许用户选择最适合其计算需求并符合其应用偏好的模型。

项目地址:https://huggingface.co/jinaai/jina-embeddings-v2-base-en?ref=jina-ai-gmbh.ghost.io

官方介绍网址:https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai/

JinaAI 推出 jinaembeddingsv2 全球首个8k开源文本嵌入模型

0001

评论列表

共(0)条

相关推荐

站长资讯
老黄：元宇宙是个江湖
互联网江湖已经沉寂了很多年。2021年，耐不住寂寞的扎克伯格，突然宣称打通了任督二脉，在门派中特设元宇宙堂口，名“Meta”，一副拳打南山猛虎、脚踢北海蛟龙的气概，誓要在江湖卷起滔天巨浪。扎大佬“嗷”的一嗓子往前冲，其他大佬面面相觑后，只好撒丫子跟着跑。后世史载，2021年为元宇宙元年。
站长网2023-04-14 14:58:32
0000
站长资讯
长安汽车竞价一字涨停此前与华为成立新公司
长安汽车A股今日开盘一字涨停，报19.56元，最新市值1940亿元。此前，华为与长安汽车在深圳签署了《投资合作备忘录》，拟成立一家新公司，聚焦智能网联汽车的智能驾驶系统及增量部件的研发、生产、销售和服务。
站长网2023-11-27 10:36:57
0000
站长资讯
县城消费觉醒，掀开万亿掘金潮
县城创业，如何复制造富神话?中国有2000多个县级行政区，国土面积占九成，人口占一半。这么“大”的县城，过去在消费者心中的存在感并不强，直到这几年，回到家的北漂、沪漂青年们，不仅发现老家县城大变样，更是惊叹无数“小镇贵妇”的衣食住行焕然一新，撑起了县城消费的一片天。
站长网2024-03-05 11:54:20
0000
站长资讯
报告：百度智能云位居中国人工智能基础数据服务市场份额第一
近日，专业咨询服务机构德勤发布《2022年人工智能基础数据服务白皮书》。白皮书显示，百度智能云位居人工智能基础数据服务市场份额第一，市场占有率近18%。
站长网2023-04-13 08:43:37
0000
站长资讯
华人团队颠覆CV！SEEM模型可一键分割图像和视频
继Meta的「分割一切」之后，又一个颠覆CV的模型来了!近日，威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEM模型，通过不同的视觉提示和语言提示，一键分割图像、视频。论文地址:https://arxiv.org/pdf/2304.06718.pdfSEEM模型是一种新型的分割模型，这一模型可以在没有提示的开放集中执行任何分割任务，比如语义分割、实例分割和全景分割。
站长网2023-04-23 18:08:29
0000