LangSplat:精准搜索3D世界中的对象 比LERF快199倍
划重点:
🚀 创新方法:LangSplat通过将CLIP特征映射到一组3D语言高斯中,实现了精准的3D语言场,比LERF快199倍。
🌍3D语言场:文章介绍了LangSplat,构建了一个3D语言场,支持在3D空间内进行精准高效的开放式语言查询。
🎨 视觉效果:LangSplat通过可视化学习特征,准确捕捉物体边界,无需后处理,同时在1440×1080分辨率下比LERF快199倍。
LangSplat 是一种3D 语言高斯模型,允许您按语言搜索3D 世界 。
清华大学和哈佛大学的研究人员开发了LangSplat,这是一种新的人工智能系统,可以在3D空间中高效、准确地搜索开放词汇。据称,该系统在速度和准确性方面显着优于之前最先进的方法LERF 。
加州大学伯克利分校的研究人员于2023年3月提出了语言嵌入式辐射场 (LERF)。该系统将大型语言模型集成到NeRF中,无需特殊训练即可在3D 环境中实现准确的物体识别。例如,书店 NeRF 环境中的用户可以根据愿景以自然语言搜索特定书名。该技术还可用于机器人技术、模拟中机器人的视觉训练以及人类与3D 世界的交互。
LangSplat 速度快了近200倍,而且更准确
然而,LERF 不适合实时搜索并且相对不准确。LangSplat 使用3D 高斯构建3D 语言场。研究人员表示,这种方法避免了 NeRF 所需的复杂渲染过程。在1440x1080像素的分辨率下,LangSplat 比 LERF 快199倍。
为了形成3D 语言场,LangSplat 使用 Meta 的Segment Anything Model从场景的多个图像中学习分层语义。具体来说,图像被分解为边界清晰的不同对象掩模,其中对象进一步分解为整体、部分和子部分。然后,学习到的掩模由 CLIP 进行处理,其嵌入训练一个自动编码器,然后用于训练 LangSplat 的3D 语言高斯函数。
LangSplat 可以区分汤的成分
LangSplat 更加准确:在一个示例中,团队要求标记“一杯茶”。LERF 标记两个杯子,而 LangSplat 标记玻璃杯中的液体。在另一个例子中,它可以标记一碗拉面汤中的各个成分。


研究人员在两个数据集(LERF 数据集和3D OVS 数据集)上测试了 LangSplat。在这两种情况下,LangSplat 在速度和准确性方面都明显优于 LERF。具体而言,LangSplat 在 LERF 数据集上的总体准确度为84.3%,在3D OVS 数据集上的总体准确度为93.4%,而 LERF 的总体准确度分别为73.6% 和86.8%。
该团队认为进一步提高速度是可能的,尤其是在更高分辨率的情况下。
项目体验网址:https://top.aibase.com/tool/langsplat
穿越电商20年,淘宝“回归生态”的样本观察
前言:营销大师科特勒在面向数字化时代所提出的“5A模型”(认知(Aware)、吸引(Appeal)、询问(Ask)、行动(Act)和拥护(Advocate)),大多数企业非常重视Ask,也就是从对产品感兴趣转入采取行动的关键时间点,但“Advocate”才是今天的致胜关键。最近听说不少商家又开始做淘宝了。准确说不只淘宝,天猫新增品牌数量也比去年同期多出了75%。站长网2023-08-11 14:07:540000Jim Cramer警告随着AI股票呈下跌趋势,许多股票可能不值得炒作
本文概要:1.CNBC知名主持人JimCramer警告说,许多标榜自己拥有生成式人工智能能力的公司可能不值得炒作。2.除了Nvidia之外,许多AI公司似乎没有真正利用AI实现盈利。3.目前AI股票整体表现不佳,很多公司似乎缺乏明确的AI能力规划。站长网2023-08-15 15:55:140000Google Assistant 迎来 Windows Copilot 时刻 而这一切都要归功于人工智能
站长之家(ChinaZ.com)10月8日消息:语音助手曾经是大约十年前人工智能的巅峰,但随着生成式人工智能的崛起,它们在某种程度上已经显得过时。尽管需要升级,谷歌一直忽略了其语音助手,而是追求更雄心勃勃的项目,如其GoogleBard聊天机器人——一直到现在。站长网2023-10-08 09:21:090000Bing Chat 推出 GPT-4Turbo 模型 但仅限部分用户试用
据外媒报道,微软正在向BingChat推出ChatGPT的最新模型,GPT-4Turbo。该模型是现有GPT-4模型的升级版,包含截至2023年4月的信息,因此在搜索新事件时可以返回更好的结果。目前,GPT-4Turbo仅适用于选定的随机测试者。微软计划在未来几周内扩大推出范围。站长网2023-12-25 18:52:270000掌趣科技与悠米达成合作 共同开发“AI游戏创作平台”
站长之家(ChinaZ.com)6月25日消息:近日,北京掌趣科技股份有限公司同北京悠米互动娱乐科技有限公司达成战略合作。通过整合双方的核心技术及优势资源,掌趣科技与悠米将共同开发“AI游戏创作平台”,降低开放世界游戏的开发门槛,实现个人及小团队也可以开发大规模的开放世界游戏,并通过该平台分享游戏成果。站长网2023-06-26 00:57:280000