CRM:上传图片生成3D模型,10秒搞定
划重点:
1. 🚀Convolutional Reconstruction Model(CRM)是一种高保真度的前馈单图像到3D生成模型,充分考虑了稀疏3D数据的限制,强调了在网络设计中整合几何先验的必要性。
2. 🖼️CRM通过生成六个正交视图图像,经过卷积U-Net处理,利用其强大的像素级对齐能力和显著的带宽,创建了高分辨率的三平面
3. ⏱️ 模型在仅10秒内从图像中生成高保真纹理网格,无需任何测试时优化。
近期,清华大学的研究团队在图像处理领域取得了重要进展,他们提出了一种名为Convolutional Reconstruction Model(CRM)的前馈式单图像到3D纹理网格生成模型。与传统的大型重建模型(LRM)相比,CRM在生成速度上表现出色,同时克服了基于Transformer的方法在几何先验方面存在的不足。

传统的3D生成模型虽然在生成速度上有所突破,但由于Transformer方法未充分利用三平面组件的几何先验,导致在有限的3D数据和缓慢的训练情况下质量不佳。为了解决这一问题,研究团队提出了CRM,一个高保真度的前馈式单图像到3D生成模型。
CRM的关键观察是,三平面的可视化呈现出六个正交图像的空间对应关系。模型首先从单个输入图像生成六个正交视图图像,然后将这些图像输入卷积U-Net进行处理,利用其强大的像素级对齐能力和显著的带宽,创建高分辨率的三平面。与此同时,CRM采用Flexicubes作为几何表示,实现对纹理网格的直接端到端优化。
整个推理过程仅需要在A800GPU上花费约10秒的时间,其中包括U-Net的前向传播(不到0.1秒)、查询表面点的UV纹理和文件I/O。与传统方法相比,CRM从图像中仅需短短的时间就能生成高保真度的纹理网格,无需在测试时进行任何优化。

图中,展示了整个方法的流程。输入图像首先经过多视图图像扩散模型,生成六个正交图像。然后,另一个扩散模型用于生成基于这六个图像的CCMs(conditional convolutional masks)。最后,这六个图像和CCMs一起输入CRM,重建最终的纹理网格。
研究团队通过生成的纹理网格展示了CRM的性能,包括玫瑰、青蛙、大象、哆啦A梦、猫和校车等互动网格。同时,CRM还展示了其在创建类似乐高风格的对象方面的潜力。

在与现有方法的比较中,CRM展现出了卓越的性能和效率。研究团队通过BibTeX引用了他们的工作,这表明了对该模型的高度认可。
这一项研究为单图像到3D纹理网格的生成提供了一种新的前馈式模型,具有卓越的速度和质量,为图像处理领域带来了新的可能性。
项目入口:https://top.aibase.com/tool/crm
OpenAI高层巨变:联创辞职总裁休假,网友:领导层成了空壳
刚刚,OpenAI高层大地震:联创JohnSchulman辞职跑路,联创&总裁GregBrockman长期休假,产品副总裁PeterDeng也被曝离职。JohnSchulman(约翰·舒曼),长年领导OpenAI强化学习团队,被誉为“ChatGPT架构师”。也是他在IlyaSustkever离开之后,临时接管了超级对齐团队。站长网2024-08-06 14:02:380000AI日报:苹果AI手机iPhone 16发布;Kimi API已支持联网搜索功能;AI面部表情编辑神器Reshot AI
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、苹果首款AI手机发布!iPhone16全新AI功能体验感拉满站长网2024-09-12 02:31:540000苹果深夜扔出M4核弹,iPad Pro碾压所有AI PC!280亿晶体管3nm工艺称霸地表
【新智元导读】苹果发布会,一如既往的惊喜。地表最强iPadPro,号称史上最薄苹果产品。芯片直接跨到了M4,有着苹果史上最大神经网络引擎,性能直接吊打当今所有AIPC。不出所料,发布会上,苹果又开大了!此次发布会的一系列重磅更新,都是围绕着主角iPad展开。库克直言:这将是iPad诞生以来的一个里程碑。站长网2024-05-09 00:16:190000iPhoneSE 4设计曝光 或配备4800万像素后置摄像头
据最新消息,苹果将对iPhoneSE4进行重大升级,包括重新设计的外形和大幅提升的配置。iPhoneSE4的内部代号为"Ghost",目前内测机型的外观与iPhone14基本相同,并保持一致的参数。未来可能会进行调整。值得一提的是,iPhoneSE4将采用USB-C接口,并摒弃静音拨片,改用与iPhone15系列相同的操作按钮。站长网2023-09-28 09:43:220000AMD差一点收购英伟达:前工程师自曝内幕 太可惜了!
快科技7月6日消息,据国外媒体报道称,AMD前工程师近日公开表示,21世纪初期AMD差点就收购了英伟达公司,但最终没有成功非常可惜。这位工程师名叫HemantMohapatra,在AMD工作的6年多时间里,帮助设计了CPU、APU和GPU等产品。0000