研究人员:矢量数据库并非是解决构建LLM内存不足的唯一方式
站长网2023-12-21 16:32:220阅
在过去的12个月里,矢量数据库的兴起使得解决语言模型长期记忆不足的问题成为热门话题。然而,研究人员提出了对这些矢量数据库常见方法的反思,并主张构建搜索引擎而非矢量数据库。
矢量数据库并非是解决内存不足问题的唯一方式,而是更像是一种特殊的搜索工具。以构建LLM(Large Language Models)驱动的文档体验为例,研究人员指出将所有文档嵌入矢量数据库并进行矢量搜索的方法存在问题,因为矢量搜索仍可能产生与传统搜索相同的问题,如结果中包含不相关或缺失的文档。

建议的替代方案是首先构建一个足够好的搜索引擎,使其适用于人类使用。利用嵌入技术,特别是结合关键词搜索和矢量搜索,可以显著提高搜索性能。文章强调了现代AI的进展使得构建先进搜索引擎变得更加容易,成本更低。
最终阶段是对传统搜索流程进行重新排名。通过使用LLMs,可以通过将查询-结果对提供给模型来进行重新排名,而无需像以前那样专门构建一个排名模型。这使得构建先进搜索引擎的回报非常高。
研究人员提到了部署搜索引擎后需要解决的问题,即如何评估搜索引擎的性能。这包括回答关于何时进行搜索、实际定位的内容以及内容在结果中的排名等问题。作者建议构建评估和监控基础设施,以便迭代搜索流水线并知道所做的更改是否是改进。
0000
评论列表
共(0)条相关推荐
小红书“星”球崛起
“699元我都买不了个袜子。”6月10日,演员@张雨绮在抖音直播间带货时,这句脱口而出的话语引发众怒,随即她本人被骂上微博热搜,很多网友都对她的消费观和价值观表示了不满。后续,6月11日下午,张雨绮在微博进行回应和道歉,发表声明称(直播时)语言表达不完整,本意是想说羊毛很贵,有一些羊毛袜699元都买不下来。@张雨绮微博截图站长网2023-06-21 14:41:150001视觉中国与华为云合作 携手打造视觉大模型
视觉(中国)文化发展股份有限公司与华为云计算技术有限公司正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型。据悉,视觉中国是一家国际知名的以“视觉内容”为核心的互联网科技文创公司,依托人工智能、大数据、区块链、云计算等互联网技术,聚合超过4亿的优质图片、视频、音乐等数字内容,打造了以“优质内容智能科技”为核心驱动的智能交易与服务平台。站长网2023-10-09 13:51:590000OPPO Find X7宣布支持AI通话摘要 通话结束即可一键生成
今日,OPPO官方宣布,FindX7成为首款支持AI通话摘要的手机。用户在通话结束后,只需一键,即可生成摘要,并自动创建待办事项和提醒。此外,OPPO表示,在人工智能领域持续发力,最新推出的安第斯大模型拥有高达70亿的参数。这款大模型为全新小布助手赋予了强大的功能,支持AI文章摘要、小布问答、AIGC消除以及AI通话摘要等。并准备了AI画师、小布照相馆、小布连麦等100多种功能。站长网2024-01-08 15:58:560000AI日报:阿里开源文档模型DocOwl 1.5;Midjourney图像编辑器新功能下周上线;Viggle AI推对口型功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、表格、图表统统拿下!阿里达摩院开源DocOwl1.5无需OCR,高效“读懂”文档!站长网2024-10-21 16:00:510000【话媒堂】首播GMV破百万,@大小姐 TRACYCHU 如何在直播电商乘风破浪?
“服装是一种语言,穿对是一种能力”这是@大小姐TRACYCHU抖音账号主页的一句话,作为中国高端女装TRACYCHU品牌主理人,@大小姐TRACYCHU有着12年从业经验,凭借对行业趋势的敏锐洞察,她的品牌顺利从线下转至线上,在直播带货领域成功突围。本期,克劳锐邀请@大小姐TRACYCHU来到了大咖专访精品栏目——《话媒堂》,一起来聊聊品牌故事以及未来发展规划。站长网2023-11-30 09:37:460000