新型3D生成方法DMV3D:使用基于Transformer的3D大型重建模型进行去噪
**划重点:**
1. 💡 DMV3D是一种单阶段的、类别不可知的扩散模型,能够通过直接模型推理从文本或单一图像输入条件生成3D神经辐射场(NeRFs),显著缩短了创建3D对象所需的时间。
2. 💡 DMV3D集成了3D NeRF重建和渲染到其去噪器中,创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型,消除了为潜在空间扩散单独训练3D NeRF编码器的需要。
3. 💡 基于大型Transformer模型,研究人员通过近期的3D大型重建模型(LRM)构建了一个新颖的联合重建和去噪模型,能够处理扩散过程中的各种噪声水平。
近期,Adobe研究人员与斯坦福大学团队联合提出了一种名为DMV3D的全新3D生成方法。该方法旨在解决增强现实(AR)、虚拟现实(VR)、机器人技术和游戏等领域中3D资产创建的共同挑战。尽管3D扩散模型在简化复杂的3D资产创建过程方面变得越来越受欢迎,但它们需要访问用于训练的地面真实3D模型或点云,这对于真实图像而言是一项挑战。
现有的解决方案虽然可以解决这一挑战,但通常需要大量手动工作和优化过程。因此,Adobe研究人员与斯坦福大学团队一直致力于使3D生成过程更快、更真实和更通用。他们近期发布的论文介绍了一种新的方法,即DMV3D,这是一种单阶段的、类别不可知的扩散模型。
DMV3D的关键贡献包括使用多视图2D图像扩散模型进行3D生成的开创性单阶段扩散框架。同时,引入了大型重建模型(LRM),这是一种多视图去噪器,可以从嘈杂的多视图图像中重建无噪音的三平面NeRFs。该模型提供了一个通用的概率方法,用于高质量的文本到3D生成和单图像重建,实现了快速的直接模型推理,在单个A100GPU上仅需约30秒。
DMV3D将3D NeRF重建和渲染集成到其去噪器中,创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型。这消除了为潜在空间扩散单独训练3D NeRF编码器的需要,并简化了每个资产的优化过程。研究人员巧妙地使用了围绕物体的四个多视图图像的稀疏集合,有效地描述了一个3D对象,而没有明显的自遮挡问题。
通过利用大型Transformer模型,研究人员解决了稀疏视图3D重建的挑战性任务。基于最近的3D大型重建模型(LRM),他们引入了一种新颖的联合重建和去噪模型,能够处理扩散过程中的各种噪声水平。在大规模合成渲染和真实捕获的数据集上进行训练,DMV3D在单个A100GPU上展示了在约30秒内生成单阶段3D的能力。它在单图像3D重建方面取得了最新的成果。
该研究为通过统一3D重建和生成的2D和3D生成模型的领域之间的鸿沟,以解决3D视觉和图形领域中的各种挑战,提供了新的视角和可能性。
项目网址:https://justimyhxu.github.io/projects/dmv3d/
论文网址:https://arxiv.org/abs/2311.09217
微软开源“傻瓜式”类ChatGPT模型训练工具,提速省钱15倍
站长网2023-04-14 09:38:460001百度网盘推出高级图搜功能 更全面、更准确
百度网盘推出高级图搜功能,帮助用户快速找到上万张照片和视频。通过基于向量的语义搜索,百度网盘能够理解包含时间、地点、人物、事件等多个要素的组合搜索语句,提供更准确、全面的搜索结果。网盘还支持OCR识图和以图搜图功能,可以自动关联百科信息和全网信息,大大扩展了信息检索的维度。为了提高搜索速度,百度网盘充分利用云上算力,压缩本地索引大小,采用异构算力调度系统。站长网2023-07-18 00:04:330000小米SU7官方实拍照首曝 魅族称要成为小米首位车主
快科技12月28日消息,小米汽车SU7已经公布了实拍图,这引来不少网友的围观,不少人直呼要成为车主,其中也包含了魅族科技。魅族科技官微表示,大定订金已备好,准备成为SU7首位车主。随后,魅族科技助理副总裁万志强解释称,手车互联更是手车互荣,两个行业的精华碰撞,最终都是消费者的体验提升,FlymeAuto等队友。站长网2023-12-28 13:57:040000研报显示 AI+3D 模型或成为继 AI+文字/图片/音频/视频后的高门槛的落地场景
中金公司7月18日研报指出,在工业领域,传统AI模型(如数据分析预测、工业视觉等)应用已经相对成熟,但大语言模型(LLM)应用方兴未艾。中金观察到LLM应用正按照经营管理侧、生产控制侧、研发设计侧的顺序逐步落地,早期落地以企业知识库应用和数据分析应用等业务支持系统为主,尚未涉及核心设计和生产环节。站长网2023-07-18 18:29:350000Sam Altman放豪言:OpenAI训GPT-5不差钱,人类已接近AGI阈值
【新智元导读】前段时间,OpenAICEOSamAltman和CTOMiraMurati在WSJ的专访里,探讨了AGI、未来GPT的发展、以及AI对人类的影响。「OpenAI的最终目标为什么是AGI?什么是AGI?」「ChatGPT以及其他语言模型的用途是什么?」「人类与人工智能的关系在未来会发生什么变化?」0000