即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象
要点:
1. OVIR-3D是一个开放词汇的3D实例检索系统,能够在没有对3D数据进行训练的情况下,从RGB-D视频和语言查询中返回排名的3D实例段。
2. 该系统通过将问题视为从语言引导的2D区域提议进行3D融合的问题,提供了一种直观而有效的解决方案,避免了由于缺乏足够种类的注释3D数据而难以直接训练开放词汇3D分割模型的问题。
3. OVIR-3D的流程包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等步骤,具有广泛的应用前景,同时有相关研究作品OVSG。
OVIR-3D是一个开放词汇的3D实例检索系统,它以直观而有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用(如操纵和导航)提供了解决方案。OVIR-3D的核心思想是直接训练开放词汇的3D分割模型在实践中变得困难,因此它从语言引导的2D区域提议出发,通过在大量2D数据集上进行训练,将2D实例信息在3D空间中投影和融合,以实现快速检索。
项目地址:https://github.com/shiyoung77/ovir-3d
OVIR-3D的使用包括下载仓库、安装依赖、演示、数据集准备、2D到3D融合和推理等多个步骤。作者提供了详细的使用说明,包括如何获取仓库、安装依赖以及演示过程。此外,系统支持自定义数据集的准备,通过开源的实感相机和KinectFusion实现,用户能够以指定格式录制和重建自定义3D场景。
在OVIR-3D的背后,Detic作为2D区域提议网络的骨干,通过查询Imagenet21k的所有类别,生成置信度阈值为0.3的输出蒙版和文本对齐特征。这一步骤的输出被存储在特定文件夹中,用户可以选择保存2D可视化,尽管这可能会降低推理速度。
对于2D到3D的融合,OVIR-3D提供了一种算法来处理多个3D场景的并行融合,但作者建议至少拥有11GB内存的显卡以避免在处理大场景时出现内存问题。一旦融合完成,用户可以通过instance_query.py脚本与系统进行交互,检索3D实例。
论文中提到OVIR-3D作为开放词汇问题的一个解决方案,强调其评估方式采用信息检索标准mAP,这是一种更合理的度量方式,尽管略有不同于通常用于封闭集实例分割的mAP度量。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。
苹果应用商店崩了上热搜 网友反馈无法下载App
10月16日晚,苹果AppStore应用商店遭遇了全球范围内的崩溃事件,导致大量用户无法下载新的应用程序。尽管应用更新功能未受影响,但用户在社交平台上纷纷反馈了无法下载App的问题。0000昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色,而且还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。Skywork-MoE模型特点:开源和免费商用:Skywork-MoE的模型权重、技术报告完全开源,且免费商用,无需申请。站长网2024-06-04 14:53:430000“去董宇辉化”后,东方甄选活在“带货大主播”的困境里
整个6月,可谓东方甄选的多事之秋。此前舆论关注点包括“东方甄选直播间画风变了”、“东方甄选知识带货变喊麦带货”,俞敏洪吐槽“做得乱七八糟”引发热议后道歉,董宇辉在访谈节目中自曝“非常痛苦”、“不享受直播带货”等等,引发股价起伏。站长网2024-07-03 09:10:040000比微博大 V 更会蹭热度的,可能是低调的网文作者们。
朋友们,你还记得姜萍吗?关于她的故事,前段时间在网络上十分流行,感兴趣的可以搜搜看。今天我们要聊的是姜萍,却又不是姜萍。因为你们根本想不到我是在哪把这热点被动追完的,不是微博、也不是抖音。。。而是:起点中文网。短文短视频博主们追热点可太常见了,毕竟这一行讲究的就是效率,大家都门清。但现在我却发现,在网文这种动辄几百万字的长篇小说圈子里,作者们追热点的姿势,早就已经超进化了。站长网2024-07-18 11:44:480000短篇作者为何能在UC故事会月入过万
UC故事会的内容机制和平台策略,帮助很多作者都实现了月入过万的小目标,也让他们在这里找到了更多人生新的可能。短篇作者叙白这个月几乎没更新,但今年3月在UC故事会发布的短篇还在为她贡献着每月一两万的收益。UC故事会是UC浏览器小说频道的重要品类之一,其中有海量的独家短篇小说。这种短篇故事在内容上沿袭了传统网文的经典类型,但篇幅更短,节奏更紧凑,10分钟左右就能读完一篇完整内容,深受用户喜爱。0000