研究人员:矢量数据库并非是解决构建LLM内存不足的唯一方式
站长网2023-12-21 16:32:220阅
在过去的12个月里,矢量数据库的兴起使得解决语言模型长期记忆不足的问题成为热门话题。然而,研究人员提出了对这些矢量数据库常见方法的反思,并主张构建搜索引擎而非矢量数据库。
矢量数据库并非是解决内存不足问题的唯一方式,而是更像是一种特殊的搜索工具。以构建LLM(Large Language Models)驱动的文档体验为例,研究人员指出将所有文档嵌入矢量数据库并进行矢量搜索的方法存在问题,因为矢量搜索仍可能产生与传统搜索相同的问题,如结果中包含不相关或缺失的文档。

建议的替代方案是首先构建一个足够好的搜索引擎,使其适用于人类使用。利用嵌入技术,特别是结合关键词搜索和矢量搜索,可以显著提高搜索性能。文章强调了现代AI的进展使得构建先进搜索引擎变得更加容易,成本更低。
最终阶段是对传统搜索流程进行重新排名。通过使用LLMs,可以通过将查询-结果对提供给模型来进行重新排名,而无需像以前那样专门构建一个排名模型。这使得构建先进搜索引擎的回报非常高。
研究人员提到了部署搜索引擎后需要解决的问题,即如何评估搜索引擎的性能。这包括回答关于何时进行搜索、实际定位的内容以及内容在结果中的排名等问题。作者建议构建评估和监控基础设施,以便迭代搜索流水线并知道所做的更改是否是改进。
0000
评论列表
共(0)条相关推荐
支持百亿参数大模型、卢伟冰现场官宣小米首发,高通骁龙8s Gen3发布
高通又往中高端手机市场扔下一颗「重磅炸弹」。高通最强手机芯片骁龙8Gen3迎来了一款与它同源的「旗舰级」产品。3月18日,高通正式推出了第三代骁龙8s移动平台(骁龙8sGen3),凭借旗舰级的CPU、GPU和AI性能,全方位支持了强大的终端侧生成式AI功能、始终感知的ISP、超沉浸的移动游戏体验、突破性连接能力和无损高清音频。站长网2024-03-19 11:58:280000明略科技开源TensorBoard.cpp 提升模型训练监测效率
明略科技开源了TensorBoard的C接口,用于监控大模型预训练过程,该工具可通过可视化模型参数和结果来分析训练状态,提升大模型训练进程和效果。以往TensorBoard只支持Python语言接口,此次明略科技通过C实现,丰富了基于C的大模型项目工具集。改写后的工具将通过多维度的数据模式展示训练指标,包括标量、直方图、图像、音频等。站长网2023-08-11 15:08:290000周星驰拍短剧,上线第一集已入账3000万?
微短剧市场正在迎来“正规军”,这一次,来的是周星驰。6月2日,周星驰出品的短剧《金猪玉叶》上线,开播首小时播放量即破百万,截至发稿前,更新的第一集已经引起业内的广泛关注,两天时间播放量就超过了3100万。站长网2024-06-06 17:43:000001Getty与Nvidia合作推文生图AI平台Generative AI by iStock
划重点:📸iStock的生成式AI:GettyImages和Nvidia合作推出GenerativeAIbyiStock,这是一款专门为制作库存照片而设计的文本到图像平台。💡面向小中型企业:该平台旨在帮助小中型企业更高效地获取所需的照片,提供个人或单用户的使用方案。站长网2024-01-09 15:32:210000大模型创业“生死局”:融资困难、造血乏力、卖身离场
ChatGPT诞生两年,创业淘汰赛加速AI大模型的淘汰赛,在今年5月按下加速键。今年5月,为了吸引用户,云厂商大模型掀起了一场推理算力价格战。字节跳动旗下的火山引擎、阿里云、百度智能云、腾讯云、科大讯飞先后加入降价行列,把大模型推理算力价格下降了90%。0000