CoDA开源:可在3D场景中检测和命名新物体
站长网2023-10-08 11:53:331阅
CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:
1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。
2. 基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。

项目地址:https://yangcaoai.github.io/publications/CoDA.html
新对象发现可以直接影响跨模态对齐,更好的特征对齐又可以反过来提升定位能力,形成一个统一的开放词汇3D检测框架。
CoDA的创新之处在于:
1. 提出利用3D几何和2D语义联合发现新对象,实现开放词汇场景下的新对象定位。
2. 基于发现的新对象,进行跨模态特征对齐,实现新对象的分类。
3. 新对象发现和跨模态对齐协同训练,相互促进,形成一个端到端框架。
与仅利用CLIP进行开放词汇检测的方法相比,CoDA可以发现更多新对象,同时检测更多已知类别目标,实现了更好的开放世界检测能力。
综上,CoDA是一个非常创新的开放词汇3D目标检测框架,旨在解决这个领域的两个核心问题:新对象的定位和分类,具有非常高的学术价值和应用前景。
0001
评论列表
共(0)条相关推荐
苹果 MR 设备采用双接口设计 已进入最后冲刺与供应链拉货阶段
站长之家(ChinaZ.com)4月24日消息:据彭博社MarkGurman最近消息,苹果AR/VR头显将在今年6月的WWDC上发布,并提供两个接口:一个用于数据传输的USB-C接口和一个用于连接电池的专有磁性接口。站长网2023-04-24 11:23:040000手机厂商内卷杀红了眼,能否“卷”出销量?
当下及未来很长一段时间里,支撑AI背后的芯片的全面更新,或将为整个手机行业带来了更多新的思路。“金九”高端机,“银十”旗舰机,手机厂商在今年秋天又杀红了眼,卯着劲用新品吸引用户换机、抢占更多市场份额。站长网2024-10-09 03:31:110000董宇辉对话余承东 余承东回应华为25亿元转让问界品牌:AI开头品牌全球注册难度极高
站长网2024-07-16 08:18:140000高通骁龙8 Gen4处理器即将发布 高通骁龙峰会定档
站长之家(ChinaZ.com)6月13日消息:骁龙峰会宣布将于今年10月21日至23日在风景如画的夏威夷毛伊岛隆重举行。此次峰会的一大亮点,无疑是即将正式亮相的高通最新移动平台——骁龙8Gen4。站长网2024-06-14 00:28:440000研究表明:大语言模型从人类反馈中学得更快更智能
划重点:1.🧠大型语言模型(LLMs)通过在线上下文学习展现了广泛的机器学习能力,使非专家能够通过语言指令编写机器人代码,根据反馈修改行为或组合执行新任务。2.🔄通过LanguageModelPredictiveControl(LMPC)框架,研究团队成功通过对机器人代码编写LLMs进行微调,提高其适应人类输入的效率,从而加速学习过程。站长网2024-02-20 16:11:070000