LangSplat:精准搜索3D世界中的对象 比LERF快199倍
划重点:
🚀 创新方法:LangSplat通过将CLIP特征映射到一组3D语言高斯中,实现了精准的3D语言场,比LERF快199倍。
🌍3D语言场:文章介绍了LangSplat,构建了一个3D语言场,支持在3D空间内进行精准高效的开放式语言查询。
🎨 视觉效果:LangSplat通过可视化学习特征,准确捕捉物体边界,无需后处理,同时在1440×1080分辨率下比LERF快199倍。
LangSplat 是一种3D 语言高斯模型,允许您按语言搜索3D 世界 。
清华大学和哈佛大学的研究人员开发了LangSplat,这是一种新的人工智能系统,可以在3D空间中高效、准确地搜索开放词汇。据称,该系统在速度和准确性方面显着优于之前最先进的方法LERF 。
加州大学伯克利分校的研究人员于2023年3月提出了语言嵌入式辐射场 (LERF)。该系统将大型语言模型集成到NeRF中,无需特殊训练即可在3D 环境中实现准确的物体识别。例如,书店 NeRF 环境中的用户可以根据愿景以自然语言搜索特定书名。该技术还可用于机器人技术、模拟中机器人的视觉训练以及人类与3D 世界的交互。
LangSplat 速度快了近200倍,而且更准确
然而,LERF 不适合实时搜索并且相对不准确。LangSplat 使用3D 高斯构建3D 语言场。研究人员表示,这种方法避免了 NeRF 所需的复杂渲染过程。在1440x1080像素的分辨率下,LangSplat 比 LERF 快199倍。
为了形成3D 语言场,LangSplat 使用 Meta 的Segment Anything Model从场景的多个图像中学习分层语义。具体来说,图像被分解为边界清晰的不同对象掩模,其中对象进一步分解为整体、部分和子部分。然后,学习到的掩模由 CLIP 进行处理,其嵌入训练一个自动编码器,然后用于训练 LangSplat 的3D 语言高斯函数。
LangSplat 可以区分汤的成分
LangSplat 更加准确:在一个示例中,团队要求标记“一杯茶”。LERF 标记两个杯子,而 LangSplat 标记玻璃杯中的液体。在另一个例子中,它可以标记一碗拉面汤中的各个成分。
研究人员在两个数据集(LERF 数据集和3D OVS 数据集)上测试了 LangSplat。在这两种情况下,LangSplat 在速度和准确性方面都明显优于 LERF。具体而言,LangSplat 在 LERF 数据集上的总体准确度为84.3%,在3D OVS 数据集上的总体准确度为93.4%,而 LERF 的总体准确度分别为73.6% 和86.8%。
该团队认为进一步提高速度是可能的,尤其是在更高分辨率的情况下。
项目体验网址:https://top.aibase.com/tool/langsplat
网友建议退订短信由营销发送方承担资费 工信部回应:将认真研究
快科技9月16日消息,大多数手机号都会经常收到商家各种营销短信,这些短信大多以回复TD退订”、退订TD”等结尾,每条营销短信你有回复退订过吗?今年7月,有网友在人民网领导留言板块留言,称建议退订短信由营销信息发送方承担资费”。对此,工信部日前回应称:将认真研究”。站长网2023-09-16 11:56:120001谷歌DeepMind提出AGI能力与行为分类框架
**划重点:**1.🌐谷歌DeepMind团队提出"LevelsofAGI"框架,类似自动驾驶级别,用于分类人工通用智能(AGI)模型及其前身的技能和行为。2.📈框架基于自主性、普适性和性能等三个维度,提供了一个共同词汇,便于比较模型、评估风险,并跟踪通向人工智能的进展。0002周鸿祎:我不是针对李彦宏 开源一定会超过闭源
快科技4月20日消息,周鸿祎发文称,并不是针对李厂长(李彦宏),自己一直是开源的信徒。周鸿祎辟谣称,自己说开源好,是13号在哈佛讲的,李彦宏说闭源好,是16号在北京讲的。据了解,第二十七届哈佛中国论坛上,周鸿祎发表演讲称:我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”站长网2024-04-21 10:13:380000微信分期上线!可分3、6、12期分期还款 消费500元以上可用
快科技6月29日消息,今日有媒体发现,微信分期”上线。据了解,该产品支持线上线下场景,可分3、6、12期分期还款,消费500元以上可用。该服务由重庆市微恒科技有限公司为用户从授信机构获得授信服务提供的综合性技术服务和解决方案。其中,分期授信服务包括消费时使用分期付款”模式和消费后使用分期周转”模式,用户可以自主选择使用。站长网2024-06-30 19:32:310000YouTube 拥有人工智能创作工具,但创作者忙于与人工智能对抗而无暇顾及
YouTube在9月中旬推出了一系列人工智能(AI)工具,旨在简化内容创建过程。然而,这些新功能似乎被平台上更广泛的生成AI问题所掩盖。这些新工具,覆盖了从生成主题到视频编辑等多种内容创建过程,本应成为游戏规则的改变者。然而,创作者们似乎更关心由生成AI带来的挑战,例如版权问题和对原创作品的破坏,最近一些高知名度的作者对OpenAI提起的诉讼就是明证。站长网2023-10-30 09:32:510000