SAGA:毫秒实现3D高斯交互分割,加速近1000倍
划重点:
SAGA(Segment Any3D GAussians)在3D场景理解和操作中取得了重要突破,能够在几毫秒内实现精细的三维分割,支持多种提示类型,包括点、涂鸦和掩码。
SAGA通过融合2D分割和3D高斯技术,以高效、快速的方式实现了3D场景的交互式分割。
SAGA能够实现多粒度分割,并在现有基准测试中展现出与最先进方法相媲美的性能,甚至在3D分割速度上实现了近1000倍的加速。
在当今数字化时代,视觉技术一直是科技创新的关键驱动力。为了解决现有方法在3D场景理解和操作中面临的挑战,来自上海交通大学人工智能研究所和华为公司的团队推出了一项引领性的科技突破。研究人员将2D的「分割一切」模型的细粒度分割能力提炼到3D高斯中,该方法命名为SAGA(Segment Any3D GAussians)。

SAGA可以在几毫秒内实现了精细的三维分割,并支持多种提示类型,包括点、涂鸦和掩码。SAGA的方法概览包括使用预训练的3DGS模型和SAM编码器提取2D特征图,然后通过高效的特征匹配检索预期的3D高斯。为了进一步增强特征紧凑性,研究者还从提取的掩码中导出点对应关系,并将其提炼为特征。在推理阶段,通过输入提示生成一组查询,再通过与学得的特征进行高效匹配,最终实现对应目标的3D高斯检索。
SAGA的论文已经在arXiv上发布,引起了科研界的广泛关注。在现有基准测试中,SAGA展现出与最先进方法相媲美的性能,甚至在3D分割速度上实现了近1000倍的加速。
SAGA(Segment Any3D Gaussians)具有以下特点:
1. **3D高效分割:** SAGA能够在几毫秒内对3D高斯中进行精细交互式分割,这对于3D场景的理解和操作具有重要意义。
2. **融合2D分割和3D高斯光斑技术:** 该方法将2D分割基础模型与最近引入的3D高斯光斑技术(3D Gaussian Splatting,3DGS)巧妙地结合起来。通过对比度训练,SAGA将由分割基础模型生成的多粒度2D分割结果高效地嵌入到3D高斯点特征中。
3. **克服挑战:** 针对现有方法在实现细粒度、多粒度分割或者面临大量计算开销,难以实时交互的挑战,SAGA提出了一种创新的解决方案。
4. **多粒度分割:** SAGA能够实现多粒度分割,并支持各种提示,包括点、涂鸦和2D掩模。
5. **快速实现:** SAGA在现有基准测试中表现出与最先进方法相媲美的性能。更重要的是,SAGA能够在几毫秒内完成3D分割,相比先前的最先进方法,加速近1000倍。
SAGA通过巧妙融合2D分割和3D高斯技术,以高效、快速的方式实现了3D场景的交互式分割,克服了以往方法的一些挑战。
项目网址:https://jumpat.github.io/SAGA/
论文地址:https://arxiv.org/abs/2312.00732
营收225亿!B站发布2023全年财报:全年实现正向经营现金流
快科技3月7日消息,哔哩哔哩今日发布了第四季度及2023全年的财报。财报显示,2023第四季度净营业额总额为人民币63亿元,2023年全年净营业额总额为人民币225亿元,与去年同期相比增加了3%,而净亏损打动了48亿,同比收窄36%。其中,2023年全年的广告营业额为64亿元,同比增加了27%;此外,2023年的增值服务营业额为人民币99亿元,同比增加了14%。站长网2024-03-07 22:55:400000AI奥林匹克数学奖推出 奖金高达500万美元
要点:陶哲轩支持的AI奥林匹克数学奖推出,奖金高达500万美元,旨在寻找能够在IMO竞赛中获得金牌的大型AI模型。AI-MO大赛要求参赛AI模型具备与人类相同的数学解题格式和生成可读答案的能力,由IMO标准评分,金牌水平的AI将获得500万美元大奖。站长网2023-11-28 18:09:420001阿里大模型产品 “通义听悟”升级 上线音视频问答助手“小悟”
阿里大模型产品“通义听悟”在今日发布了多项新功能。其中,音视频问答助手“小悟”是重点新功能之一。用户可以通过“小悟”进行自由问答,支持对单个最长6小时、一次性上百条音视频的内容理解问答。站长网2024-03-19 18:04:120000群友在群聊发捂嘴笑表情被起诉 法院:未侵权 驳回请求
据法治网消息,近日,一场微信群聊对话引发了一场官司,原因是因为一个表情符号。江苏的张某和李某是微信群的群友,某天李某在群聊中提到张某并称其坏人,同时配上了咧嘴笑和捂嘴笑的表情符号。次日,张某以侵犯名誉权为由向法院提起诉讼,要求李某在群聊中和报刊上公开道歉并赔偿损失。法院判决认为李某的行为并未侵犯张某的名誉权,驳回了张某的诉讼请求。站长网2023-10-11 17:30:580000陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股
近日,天桥脑科学研究院(Tianqiao&ChrissyChenInstitute,简称研究院)与《科学》杂志联合宣布,推出一项AI驱动科学大奖,表彰全球范围内用人工智能技术推动各个领域科学研究并取得突破性进展的青年科学家。前中国互联网大佬陈天桥,在脑科学领域深耕8年,全力投入新一代人工智能技术研发近两年,斩获颇丰,在此之际推出的这一国际大奖颇为引人瞩目。站长网2024-08-27 07:25:240000