Adobe发布创新的DMV3D方法 单个A100生成3D图像只需30秒
要点:
1. Adobe研究院和斯坦福大学的研究者提出了一种基于Transformer的3D生成方法DMV3D,利用单个A100GPU仅需30秒即可生成各种高保真3D图像。
2. DMV3D是一种全新的单阶段全类别扩散模型,通过2D多视图图像扩散、3D NeRF重建和渲染的集成,实现端到端的训练,避免了传统3D生成方法中的问题。
3. 通过使用稀疏的多视图投影作为训练数据,DMV3D能够在单个图像或文本输入的情况下实现3D生成,取得了在单图像3D重建方面的State-of-the-Art(SOTA)结果,超越了先前方法。
近期,Adobe研究院和斯坦福大学的研究者推出了一项创新的3D生成方法,命名为DMV3D。通过基于Transformer的新型单阶段全类别扩散模型,该方法能在单个A100GPU上仅需30秒的时间内生成高保真3D图像。DMV3D通过将2D多视图图像扩散、3D NeRF重建和渲染集成到一个端到端的训练过程中,成功避免了传统方法中的问题。
论文地址:https://arxiv.org/pdf/2311.09217.pdf
官网地址:https://justimyhxu.github.io/projects/dmv3d/
这项研究的关键在于使用稀疏的多视图投影作为训练数据,以解决传统3D生成方法中存在的模糊和难以去噪的问题。相比之下,DMV3D展示了在单个图像或文本输入的情况下实现3D生成的能力。通过固定一个稀疏视图作为无噪声输入,并对其他视图进行类似于2D图像修复的降噪,DMV3D能够在30秒内生成各种高保真3D图像,这一成果超越了先前基于SDS的方法和3D扩散模型。
研究者还介绍了DMV3D的训练和推理过程,包括基于重建的多视图降噪器的构建、多视图扩散和去噪的方法以及模型的时间和相机调节。此外,通过引入文本或图像的条件降噪器,DMV3D实现了可控的3D生成,为无条件生成模型提供了更多可能性。
这一创新方法的提出对于AI视觉领域的3D生成研究具有重要意义,不仅在技术上解决了传统方法的问题,而且在性能上取得了SOTA的成果。该研究为未来的VR、AR、机器人技术和游戏等应用领域提供了新的可能性。
Animagine XL 3.1发布:一个开源的SDXL动漫模型
AnimagineXL3.1,一款全新的开源动漫主题文本到图像模型,已经正式发布。该版本在原有的基础上进行了一系列的升级和优化,使其对广泛的动漫作品和风格的理解更加深入,覆盖了从古老到现代的各种艺术风格。站长网2024-03-19 17:53:3500012中国手机市场连续5个季度暴跌 越来越多手机卖不动!为啥年轻人不换新手机了?
快科技5月27日消息,近日,多家市调机构的报告显示,2023年一季度,全球手机市场出货量大幅下滑,一些知名品牌的手机出货量都同比两位数下降。值得注意的是,被寄予厚望的年轻消费者,也不再频繁更换新手机了。#为啥年轻人不换新手机了##手机销量差是因为卖的贵吗#等热搜话题引发热议。从媒体投票来看,现在手机够用、新手机价格贵/性价比低,成为当下阻碍年轻人换机的两个核心因素。站长网2023-05-27 10:22:190000《黑镜》主创称ChatGPT写剧本很糟糕 仔细看就像一坨屎
站长之家(ChinaZ.com)6月9日消息:著名科幻电视剧《黑镜》第六季将于6月15日播出。该剧主创查理·布鲁克近日接受采访时坦言,他曾使用ChatGPT写了一集《黑镜》的剧本,但结果“很垃圾”。站长网2023-06-10 08:46:490000专注数学的开源大模型LLEMMA来了 性能领先其他数学语言模型
要点:1.LLEMMA是一个开源的大型语言模型,专门设计用于解决数学问题,并且在性能上超越了其他领先的数学语言模型。2.LLEMMA能够利用工具和证明形式定理来解决数学问题,而无需进行额外的微调。3.LLEMMA的发布为其他研究人员提供了一个基础,可以在此基础上进一步研究和改进数学语言模型的能力。站长网2023-10-22 10:42:080000微软决心移除 Windows 中已用 27 年的旧技术,VBScript 走向末路
站长网2023-10-13 09:16:570000