CoDA开源:可在3D场景中检测和命名新物体
站长网2023-10-08 11:53:330阅
CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:
1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。
2. 基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。

项目地址:https://yangcaoai.github.io/publications/CoDA.html
新对象发现可以直接影响跨模态对齐,更好的特征对齐又可以反过来提升定位能力,形成一个统一的开放词汇3D检测框架。
CoDA的创新之处在于:
1. 提出利用3D几何和2D语义联合发现新对象,实现开放词汇场景下的新对象定位。
2. 基于发现的新对象,进行跨模态特征对齐,实现新对象的分类。
3. 新对象发现和跨模态对齐协同训练,相互促进,形成一个端到端框架。
与仅利用CLIP进行开放词汇检测的方法相比,CoDA可以发现更多新对象,同时检测更多已知类别目标,实现了更好的开放世界检测能力。
综上,CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。
0000
相关推荐
FTC 关注生成式 AI 的竞争担忧 着重强调关键投入问题
美国联邦贸易委员会(FTC)技术局和技术办公室在一篇博文中表示,生成式人工智能,尤其是ChatGPT,引发了竞争担忧,并成为该机构的关注重点。这两个办公室的工作人员在博文中指出:「生成式人工智能依赖于一系列必要的投入。如果一家公司或少数几家公司控制了其中一个或几个关键投入,它们可能会利用其控制权来削弱或扭曲生成式人工智能市场上的竞争。」站长网2023-06-30 22:52:220002消息称苹果将于周二发布第11代iPad:沿用当代设计
10月17日消息,据外媒报道,泄密者MajinBu透露,苹果公司将于当地时间周二推出第11代低成本iPad。他声称,第11代iPad将采用与第10代iPad相同的设计,而且配件“将完全兼容”。上周末,外媒声称,新款iPad将于本周推出。有消息称,苹果正在与特定媒体安排媒体见面会。0000英伟达推出 NeMo Guardrails 帮助企业指导和控制 AI 回应
生成式人工智能和大型语言模型(LLMs)的一个主要挑战是用户可能得到不适当或不准确的回应的风险。英伟达非常了解保护组织及其用户的需要,日前它发布了新的NeMoGuardrails开源框架以帮助解决这一挑战。NeMoGuardrails项目提供了一种方法,使为不同用例(包括聊天机器人)构建和部署LLM的组织能够确保响应保持在正轨上。站长网2023-04-27 09:54:2500017天涨粉166万,人人都有机会成为“普通人”于文亮吗?
抖音热门“变”了。鼻孔先打招呼,丝毫没有表情管理,直男自拍时的死亡角度……来自“于文亮”抖音主页,绝对没有故意截丑这些漫不经心且清晰度不高的随手拍,像极了高中班级里黑皮体育生手机相册里才会出现的内容,却意外成为最近抖音热门的内容风格。站长网2023-10-13 15:01:470000“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。站长网2024-01-22 14:21:280000