Adobe研究人员研发新AI模型LRM:实现从2D样本瞬时生成3D图像
**划重点:**
1. 💡 Adobe Research和澳大利亚国立大学(ANU)联合宣布,他们研发出首个能够从单一2D图像生成3D图像的人工智能模型。
2. 💻 新算法基于大规模图像样本训练,能够在几秒钟内生成高质量的3D图像,该算法采用了名为LRM(Large Reconstruction Model)的高度可扩展神经网络,包含一百万数据集和五亿参数。
3. 🚀 LRM的成功在于其能够利用数百万图像参数的数据库,并预测神经辐射场(NeRF),从而仅基于2D图像生成逼真的3D图像,即使这些图像是低分辨率的。
由Adobe Research和澳大利亚国立大学(ANU)联合研发的人工智能模型宣布了一项突破性的成果,能够从单一的2D图像中生成3D图像。
研究人员表示,他们的新算法在大规模图像样本上进行训练,可以在几秒钟内生成这样的3D图像。该算法采用了名为LRM(Large Reconstruction Model)的高度可扩展神经网络,包含一百万数据集和五亿参数,涵盖图像、3D形状和视频等多种数据。
该项目的领导作者、澳大利亚国立大学工程、计算和控制学院的毕业生、Adobe实习生Yicong Hong表示:“这种高容量模型和大规模训练数据的结合使得我们的模型具有很强的泛化能力,能够从各种测试输入中产生高质量的3D重建。”
据Hong介绍,早期的3D成像软件只在特定主题类别中表现良好,后来的图像生成进展是通过程序如DALL-E和Stable Diffusion实现的,它们利用了2D扩散模型的卓越泛化能力以实现多视图。然而,这些程序的结果仅限于预训练的2D生成模型。
其他系统利用每形状优化来取得令人印象深刻的结果,但根据Hong的说法,它们“通常缓慢且不切实际”。他指出,利用大规模数据的巨大变压器网络内的自然语言模型的发展激发了他的团队提出一个问题:“是否可能学习从单一图像重建对象的通用3D先验?”他们的答案是“是”。
“LRM可以从现实世界中捕获的各种图像以及由生成模型创建的图像中重建高保真度的3D形状。” Hong说道,“LRM也是下游应用的高度实用解决方案,因为它可以在仅五秒钟内生成一个3D形状,无需后期优化。”
该程序的成功在于其能够利用数百万图像参数的数据库,并预测神经辐射场(NeRF)。这意味着它能够仅基于2D图像生成逼真的3D图像,即使这些图像是低分辨率的。与之前的3D软件相比,该模型的突破性在于其快速、高效地生成高质量的3D图像,为增强现实、虚拟现实系统、游戏、影视动画和工业设计等领域带来了转变。
总的来说,LRM(Large Reconstruction Model)是一种用于从单张图像生成高保真度3D物体模型的模型。LRM通过采用大规模数据和高容量模型的组合,实现了从单张图像到3D模型的快速而准确的重建。以下是LRM的主要功能特色:
1. 快速生成:LRM能够在短短5秒内,从单张输入图像中生成高保真度的3D物体模型。
2. 大规模训练:与许多先前的方法不同,LRM采用了高度可扩展的基于transformer的架构,具有5亿个可学习参数,用于直接预测神经辐射场(NeRF)。
3. 数据多样性:模型以端到端的方式在包含大约100万个对象的大规模多视图数据上进行训练,包括Objaverse的合成渲染和MVImgNet的实际捕捉数据。
4.高通用性: 由于高容量模型和大规模训练数据的结合,LRM具有很强的通用性,能够从各种测试输入中生成高质量的3D重建,包括真实世界中的野外捕捉和生成模型的图像。
5. Transformer-Based架构:LRM采用了完全可微分的transformer-based编码器-解码器框架,通过预训练的视觉模型(DINO)对输入图像进行编码,使用大型transformer解码器通过交叉注意力将图像特征投影到3D三平面表示,然后通过多层感知器预测体积渲染的点颜色和密度。
项目页面:https://yiconghong.me/LRM/
极氪007交付已达10000台 仅用时67天
站长之家(ChinaZ.com)3月7日消息:近日,极氪智能科技宣布其首款纯电轿车极氪007交付量已达到惊人的10000台,仅用时67天,这一成绩再次彰显了极氪汽车的“极氪速度”,打破了量产破万的最快记录。作为极氪的得力之作,极氪007自去年年底上市以来,凭借其出色的性能和合理的售价,赢得了市场的广泛认可。该车共推出5款车型,售价区间为20.99万元至29.99万元,并于今年元旦开启全国交付。站长网2024-03-07 18:01:060000OpenAI 最新“神”操作:让 GPT-4 去解释 GPT-2 的行为!
由ChatGPT掀起的这场AI革命,令人们感慨神奇的同时,也不禁发出疑问:AI究竟是怎么做到这一切的?此前,即便是专业的数据科学家,都难以解释大模型(LLM)运作的背后。而最近,OpenAI似乎做到了——本周二,OpenAI发布了其最新研究:让GPT-4去试着解释GPT-2的行为。即:让一个AI“黑盒”去解释另一个AI“黑盒”。站长网2023-05-11 11:05:440000李彦宏称重复造大模型将造成极大资源浪费 应该卷AI原生应用
在2023年世界互联网大会乌镇峰会上,百度CEO李彦宏发表了对AI大模型的看法。他认为,繁荣的AI原生应用生态将推动新一轮的经济增长,但开发好用的大模型存在很高的技术壁垒和成本门槛,社会资源不应该浪费在重复造轮上。站长网2023-11-09 11:43:450001NVIDIA 高管:银行必须为人工智能热潮做好准备
全球芯片制造商NVIDIA的金融服务行业全球副总裁MalcomDeMayo表示,银行业需要为人工智能(AI)的蓬勃发展做好准备。虽然生成式AI具有潜力,但这种新一代的AI在当前银行的计算基础设施上运行效果不佳。DeMayo表示,十多年来,NVIDIA一直在人工智能领域进行大量投资,金融公司在采用创新技术方面也“并不陌生”。站长网2023-07-26 14:55:120000三星计划推出搭载生成式AI技术的智能手机
🔍划重点:1.三星电子计划于明年推出搭载生成式人工智能(AI)技术的智能手机,将AI技术内置于设备中,无需连接外部云端。2.该生成式AI技术将使用户能够通过简单指令访问各种服务,类似于ChatGPT的工作方式。3.三星正在开发自己的生成式AI技术,预计将在明年初的GalaxyS24或下半年的GalaxyZ6系列中推出。站长网2023-11-01 15:20:530000