即时3D搜索技术OVIR-3D开源可从文本提示中检索3D对象

站长网2023-11-10 10:26:342阅

要点:

1. OVIR-3D是一个开放词汇的3D实例检索系统，能够在没有对3D数据进行训练的情况下，从RGB-D视频和语言查询中返回排名的3D实例段。

2. 该系统通过将问题视为从语言引导的2D区域提议进行3D融合的问题，提供了一种直观而有效的解决方案，避免了由于缺乏足够种类的注释3D数据而难以直接训练开放词汇3D分割模型的问题。

3. OVIR-3D的流程包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等步骤，具有广泛的应用前景，同时有相关研究作品OVSG。

OVIR-3D是一个开放词汇的3D实例检索系统，它以直观而有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合，为机器人应用（如操纵和导航）提供了解决方案。OVIR-3D的核心思想是直接训练开放词汇的3D分割模型在实践中变得困难，因此它从语言引导的2D区域提议出发，通过在大量2D数据集上进行训练，将2D实例信息在3D空间中投影和融合，以实现快速检索。

项目地址:https://github.com/shiyoung77/ovir-3d

OVIR-3D的使用包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等多个步骤。作者提供了详细的使用说明，包括如何获取仓库、安装依赖以及演示过程。此外，系统支持自定义数据集的准备，通过开源的实感相机和KinectFusion实现，用户能够以指定格式录制和重建自定义3D场景。

在OVIR-3D的背后，Detic作为2D区域提议网络的骨干，通过查询Imagenet21k的所有类别，生成置信度阈值为0.3的输出蒙版和文本对齐特征。这一步骤的输出被存储在特定文件夹中，用户可以选择保存2D可视化，尽管这可能会降低推理速度。

对于2D到3D的融合，OVIR-3D提供了一种算法来处理多个3D场景的并行融合，但作者建议至少拥有11GB内存的显卡以避免在处理大场景时出现内存问题。一旦融合完成，用户可以通过instance_query.py脚本与系统进行交互，检索3D实例。

论文中提到OVIR-3D作为开放词汇问题的一个解决方案，强调其评估方式采用信息检索标准mAP，这是一种更合理的度量方式，尽管略有不同于通常用于封闭集实例分割的mAP度量。文章还提到了OVIR-3D的应用前景，以及后续工作OVSG的介绍，该工作在OVIR-3D的基础上构建3D场景图，实现更精准的对象检索。

即时3D搜索技术OVIR3D开源可从文本提示中检索3D对象

0002

评论列表

共(0)条

相关推荐

站长资讯
Gartner报告:80%企业将在2026年前采用人工智能
划重点:1.🚀人工智能潮流:自ChatGPT发布以来，生成式人工智能一直处于上升趋势，企业不断开发或采用AI模型。2.📊预测数字:Gartner报告预测，到2026年，80%的企业将使用生成式AIAPI或模型，相较于2023年的不到5%，增长显著。3.💡创新方向:报告突出了未来十年对组织产生巨大影响的创新领域，包括生成式AI应用、基础模型和AI信任、风险以及安全管理。
站长网2023-10-13 11:04:13
0000
站长资讯
AI在评论区“大杀四方”，这个世界终于颠成了我想要的样子
注意看，这个AI叫罗伯特（Robot），它正在攻击你的评论区。用户:“决定熬夜调作息了。是的，我就没有睡”罗伯特:加油，我可以坚持一个星期用户:当你看见这条信息时，我已经在同事婚宴上了。罗伯特:恭喜啊!祝你们百年好合。用户:哀吾生之须臾，羡长江之无穷。罗伯特:还有一天就考试了，加油吧。用户:抽签选课抽五门落选五门，运气特别好的一个人👍罗伯特:希望下个学期也这样🫂
站长网2024-03-15 09:04:46
0000
站长资讯
生成式AI公司Galileo推出检索增强生成工具
**划重点:**1.🚀Galileo发布了检索增强生成（RAG）和代理分析解决方案，旨在帮助企业开发可信赖的人工智能(AI)解决方案。2.🔍RAG系统通过在大型语言模型（LLMs）的通用知识基础上添加领域特定上下文，提供领域特定结果。3.🔄Galileo的工具通过将先进的见解和度量嵌入用户现有工作流中，提供对RAG工作流的每个阶段的可见性，实现快速评估、错误检测和迭代。
站长网2024-02-07 10:43:49
0000
联名兰博基尼！Redmi K70 Pro冠军版明晚开售
站长之家(ChinaZ.com)12月20日消息:RedmiK70Pro冠军版将于明晚7点直播开售。官方还透露，将有一位神秘嘉宾到场，进行一场硬核手机开箱的跨界挑战。值得注意的是，小米集团卢伟冰曾在发布会上透露，RedmiK70Pro冠军版是限量机型，喜欢这款产品的朋友千万不要错过明晚的抢购机会。
站长网站长资讯2023-12-20 11:21:01
0000
新研究：AI测谎能力比人类更强但需谨慎使用
快科技7月15日消息，据媒体报道，德国维尔茨堡大学当地时间12日公布的最新研究显示，在假新闻、政治家的可疑言论和被操纵的视频日益泛滥的时代，人工智能在测谎方面的表现比人类更佳。这项发表在《iScience》期刊上的研究，精心设计了一场实验：参与者被要求撰写周末计划，并巧妙设置半数人需撒谎以换取小额金钱奖励，共收集到来自768名参与者的1536份陈述。
站长网站长资讯2024-07-15 22:14:38
0000