新型3D生成方法DMV3D:使用基于Transformer的3D大型重建模型进行去噪
**划重点:**
1. 💡 DMV3D是一种单阶段的、类别不可知的扩散模型,能够通过直接模型推理从文本或单一图像输入条件生成3D神经辐射场(NeRFs),显著缩短了创建3D对象所需的时间。
2. 💡 DMV3D集成了3D NeRF重建和渲染到其去噪器中,创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型,消除了为潜在空间扩散单独训练3D NeRF编码器的需要。
3. 💡 基于大型Transformer模型,研究人员通过近期的3D大型重建模型(LRM)构建了一个新颖的联合重建和去噪模型,能够处理扩散过程中的各种噪声水平。
近期,Adobe研究人员与斯坦福大学团队联合提出了一种名为DMV3D的全新3D生成方法。该方法旨在解决增强现实(AR)、虚拟现实(VR)、机器人技术和游戏等领域中3D资产创建的共同挑战。尽管3D扩散模型在简化复杂的3D资产创建过程方面变得越来越受欢迎,但它们需要访问用于训练的地面真实3D模型或点云,这对于真实图像而言是一项挑战。
现有的解决方案虽然可以解决这一挑战,但通常需要大量手动工作和优化过程。因此,Adobe研究人员与斯坦福大学团队一直致力于使3D生成过程更快、更真实和更通用。他们近期发布的论文介绍了一种新的方法,即DMV3D,这是一种单阶段的、类别不可知的扩散模型。
DMV3D的关键贡献包括使用多视图2D图像扩散模型进行3D生成的开创性单阶段扩散框架。同时,引入了大型重建模型(LRM),这是一种多视图去噪器,可以从嘈杂的多视图图像中重建无噪音的三平面NeRFs。该模型提供了一个通用的概率方法,用于高质量的文本到3D生成和单图像重建,实现了快速的直接模型推理,在单个A100GPU上仅需约30秒。
DMV3D将3D NeRF重建和渲染集成到其去噪器中,创建了一个在没有直接3D监督的情况下训练的2D多视图图像扩散模型。这消除了为潜在空间扩散单独训练3D NeRF编码器的需要,并简化了每个资产的优化过程。研究人员巧妙地使用了围绕物体的四个多视图图像的稀疏集合,有效地描述了一个3D对象,而没有明显的自遮挡问题。
通过利用大型Transformer模型,研究人员解决了稀疏视图3D重建的挑战性任务。基于最近的3D大型重建模型(LRM),他们引入了一种新颖的联合重建和去噪模型,能够处理扩散过程中的各种噪声水平。在大规模合成渲染和真实捕获的数据集上进行训练,DMV3D在单个A100GPU上展示了在约30秒内生成单阶段3D的能力。它在单图像3D重建方面取得了最新的成果。
该研究为通过统一3D重建和生成的2D和3D生成模型的领域之间的鸿沟,以解决3D视觉和图形领域中的各种挑战,提供了新的视角和可能性。
项目网址:https://justimyhxu.github.io/projects/dmv3d/
论文网址:https://arxiv.org/abs/2311.09217
在直播间花7万5开盲盒回本1万3 消费者起诉返还被驳回
据宜兴市人民法院消息,近日,宜兴市人民法院审理了一起盲盒相关案件。在该案中,原告魏某通过一个开卡直播间购买了一款名为“山海经”的卡片盲盒,开出了一张“天卡”,并以3000元价格将卡片回收。由于他觉得自己的运气不错,他接连下单购买了整箱的“山海经”盲盒,共花费了75308元,但是回收的卡片仅拿到13000元。因此,他起诉了卖家和直播平台,要求退还62308元购买款。站长网2023-10-12 11:04:170000陈睿称B站虚拟主播在国内遥遥领先:将提升直播业务经营质量
在近日发布的2023年第四季度及全年财报之后,B站管理层团队,包括董事长兼CEO陈睿、副董事长兼首席运营官李旎、以及首席财务官樊欣等人,共同参与了财报电话会议。当分析师对B站的直播业务提出相关问题时,陈睿详细阐述了该平台直播业务的特色和优势。他表示,B站的直播内容大多与公司的“特色和优势品类”紧密相连,与公司在视频领域的竞争优势相契合。站长网2024-03-08 13:28:230000兼容 AI 个人电脑将改变人们的工作方式:大大提高性能、安全性和个性化
日前Canalys发文章表示,兼容AI的新一代个人电脑将改变我们的工作方式。混合云计算和本地计算将使人们能够大幅提高工作效率,释放自身的创造力。这将推动向「AI个人电脑"时代的转变,从而大大提高性能、安全性和个性化。站长网2023-09-28 11:05:240000AI应用商店是门好生意,可要如何说服开发者入驻?
无论EpicGames、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这一套体系。站长网2024-08-27 07:25:230000汤姆猫:推进移动应用内容玩法的AI化和交互创新
最近,汤姆猫在接受投资者调研时表示,在人工智能交互产品方面,公司国内外团队正在同步开发相关产品。公司国内研发团队将“汤姆猫”IP形象融入到AI交互产品功能原型中,加入了语音识别、语音合成、性格设定、内容过滤等功能。这支团队测试了语音交互、连续对话等产品性能,初步验证了相关技术的可行性,并已开始开发应用产品。站长网2023-05-08 15:31:140000