CRM:上传图片生成3D模型,10秒搞定
划重点:
1. 🚀Convolutional Reconstruction Model(CRM)是一种高保真度的前馈单图像到3D生成模型,充分考虑了稀疏3D数据的限制,强调了在网络设计中整合几何先验的必要性。
2. 🖼️CRM通过生成六个正交视图图像,经过卷积U-Net处理,利用其强大的像素级对齐能力和显著的带宽,创建了高分辨率的三平面
3. ⏱️ 模型在仅10秒内从图像中生成高保真纹理网格,无需任何测试时优化。
近期,清华大学的研究团队在图像处理领域取得了重要进展,他们提出了一种名为Convolutional Reconstruction Model(CRM)的前馈式单图像到3D纹理网格生成模型。与传统的大型重建模型(LRM)相比,CRM在生成速度上表现出色,同时克服了基于Transformer的方法在几何先验方面存在的不足。
传统的3D生成模型虽然在生成速度上有所突破,但由于Transformer方法未充分利用三平面组件的几何先验,导致在有限的3D数据和缓慢的训练情况下质量不佳。为了解决这一问题,研究团队提出了CRM,一个高保真度的前馈式单图像到3D生成模型。
CRM的关键观察是,三平面的可视化呈现出六个正交图像的空间对应关系。模型首先从单个输入图像生成六个正交视图图像,然后将这些图像输入卷积U-Net进行处理,利用其强大的像素级对齐能力和显著的带宽,创建高分辨率的三平面。与此同时,CRM采用Flexicubes作为几何表示,实现对纹理网格的直接端到端优化。
整个推理过程仅需要在A800GPU上花费约10秒的时间,其中包括U-Net的前向传播(不到0.1秒)、查询表面点的UV纹理和文件I/O。与传统方法相比,CRM从图像中仅需短短的时间就能生成高保真度的纹理网格,无需在测试时进行任何优化。
图中,展示了整个方法的流程。输入图像首先经过多视图图像扩散模型,生成六个正交图像。然后,另一个扩散模型用于生成基于这六个图像的CCMs(conditional convolutional masks)。最后,这六个图像和CCMs一起输入CRM,重建最终的纹理网格。
研究团队通过生成的纹理网格展示了CRM的性能,包括玫瑰、青蛙、大象、哆啦A梦、猫和校车等互动网格。同时,CRM还展示了其在创建类似乐高风格的对象方面的潜力。
在与现有方法的比较中,CRM展现出了卓越的性能和效率。研究团队通过BibTeX引用了他们的工作,这表明了对该模型的高度认可。
这一项研究为单图像到3D纹理网格的生成提供了一种新的前馈式模型,具有卓越的速度和质量,为图像处理领域带来了新的可能性。
项目入口:https://top.aibase.com/tool/crm
雷军:看完车展很绝望 各大厂商缺乏独特性和创新
小米CEO雷军在近期举办的2024中关村论坛年会上分享了自己参观2024北京车展后的深刻感受。他直言不讳地表达了对当前汽车市场产品同质化现象的忧虑,认为这种趋势正在侵蚀行业的创新力。站长网2024-05-06 17:52:500000董宇辉“与辉同行”个人工作室成立
企查查APP显示,近日,与辉同行(北京)科技有限公司成立,法定代表人董宇辉。注册资本1000万元,经营范围包含鲜肉零售、网络文化经营、演出经纪等。该公司注册地址与东方甄选关联公司东方优选(北京)科技有限公司为同一栋楼。此前,俞敏洪表示董宇辉将成立个人工作室,工作室产生的收益都会计入到东方甄选。点此了解更多新鲜AI产品站长网2023-12-23 15:29:430000江苏女掌柜卖新娘头饰,20年惊艳1000万场婚礼
提起2003年,你会想到什么?有人说非典,疫情肆虐,线下经济受困;有人说开创,淘宝网创立,线上经济快速增长。从那一年开始,越来越多人尝试网上购物,直至成为习惯。人们把生活日常装进购物车,甚至通过它来装点人生大事。站长网2023-05-11 17:55:440000Redmi Note 13 Pro发布:同档位最好的1.5K直屏手机 1399元起
快科技9月21日消息,RedmiNote13Pro亮相。售价方面,8GB128GB售价1399元,8GB256GB售价1499元,12GB256GB售价1699元,12GB512GB售价1899元,16GB512GB售价1999元。这款新品采用1.5K直屏,是同档位最好的直屏手机,它支持1920Hz高频PWM调光,采用华星C7发光基材,全局亮度是1200尼特,峰值亮度达到了1800尼特。站长网2023-09-21 21:00:320000iQOO 12今日开售:搭载骁龙8 Gen3 售价3999元起
iQOO12将于今日10点正式开售,起售价为3999元。这款手机配备了5000万超大底主摄、5000万超广角和6400万潜望式长焦,是首款配备潜望长焦的骁龙8Gen3旗舰。iQOO12支持3倍光学变焦,集望远拍摄、长焦微距和长焦人像三种效果于一身。在全新的NICE神经图像算法的帮助下,该手机能够实现10倍高清变焦和最大100倍变焦。站长网2023-11-14 09:24:110000