用2D图像补全3D场景,谷歌发布NeRFiller
在许多3D场景捕获中,由于网格重建失败或者缺乏观测,例如,物体接触区域或难以触及的区域,场景中的某些部分经常会出现缺失的情况。
谷歌和加州大学伯克利分校的研究人员提出了NeRFiller框架,可通过2D图像来修复残缺的3D场景,同时发现当图像形成2x2网格时,会生成更多3D一致性的修复效果。
测试数据显示,研究人员通过多个评估指标对比原始数据与重建效果,如PSNR、SSIM等。同时记录不同数据集每个迭代循环耗时,发现NeRFiller重建的效果更出色,并将重建效率提升了10倍左右。
即将开源地址:https://github.com/ethanweber/nerfiller
论文:https://arxiv.org/abs/2312.04560
通常3D修复目标是完成一个包含缺失区域场景,例如,由多视图重建方法获得的场景,其中可能存在由于网格重建失败导致的“空洞”。NeRFiller则是要填充这些缺失区域,生成一个完整的3D场景。
所以,NeRFiller的整体修复思路主要分为两大块:使用联合多视角图像补全一致性的3D模型,以及通过对3D场景表示的迭代优化,将这些2D图像补全整合到全局一致的3D场景中。
联合多视角图像补全
使用独立的2D补全模型进行多视角图像的补全存在一致性问题,因此NeRFiller提出了网格先验和联合多视角补全两种策略,来提高一致性。
1)网格先验
研究人员发现,将四幅图像缩放到较低分辨率后以2x2网格形状提供给补全模型,可以获得更加一致的补全结果。可能这是由于在补全模型的训练数据中,存在很多视图示例。
方法是将4幅图像的潜在表示缩放到1/4分辨率,拼接成2x2网格后提供给扩散模型,对网格进行联合预测和采样。
最后再还原到原分辨率。这与最近的视频编辑方法使用的延长注意力机制有相似之处。
2)联合多视角补全
直接将大量图像制作成网格会降低分辨率。为了保持分辨率,NeRFiller使用了一种将网格先验推广到任意数量图像的策略。
该策略类似于MultiDiffusion的方法,每次迭代时随机将图像分组到2x2网格中,重复多次后对每个图像的噪声预测进行平均。这样可以在不降低分辨率的情况下增加有效的网格大小。
3D场景重建
上述的联合多视角图像补全,还无法更好的保证3D场景一致性。所以,NeRFiller使用了一种将2D补全结果整合到3D场景表示的迭代方法。整体流程如下:
渲染训练视角子集;
对渲染图像添加噪声,进行联合多视角补全;
用补全结果更新训练数据集中对应图像。
不断重复该流程,直到重建结果达到目标。此外,为了优化3D场景的几何形态,NeRFiller在室内场景中可加入了相对深度的监督,补全后预测深度,只对补全区域施加排序损失。
本文素材来源NeRFiller论文,如有侵权请联系删除
12306回应一些车次为何开售即秒光 称未将票额分配给第三方平台
针对“火车票难买一些车次开售即秒光”的问题,中国铁路官方回应称,今年春运期间,尽管铁路部门尽最大努力安排了运输能力,将全部客车投入运营,每日最多可提供1070万个客票席位,但由于旅客出行需求极度集中、极不均衡、单向流动等特点,加上部分机构平台采用代购、抢票、囤票等特殊手段加价牟利,使得火车票供需矛盾仍然十分突出。站长网2024-02-05 08:27:160000华为向P30/Pro用户推送鸿蒙HarmonyOS 4版本更新
华为近日向P30/Pro手机用户推送了鸿蒙HarmonyOS4花粉Beta版更新。这一更新包大小达到了5.83GB,为手机带来了众多新功能,包括实况窗等。作为一款发布于2019年4月的老机型,华为P30系列能够获得鸿蒙4的更新可谓是一大惊喜。0000开源声音与音乐生成模型AudioLDM2 只需提供文本即可生成高质量音频
最近,一款优秀的开源声音与音乐生成模型AudioLDM2在GitHub上引起了关注。这个模型的运行速度很快,可以生成节奏、音效和基本对话。它操作简单,并具有强大的提示样式鲁棒性。该模型采用了先进的隐式扩散模型AudioLDM,可以生成高质量的音频。用户只需要提供文本描述,就可以让模型自动生成对应的音频。项目地址:https://github.com/haoheliu/AudioLDM2站长网2023-08-30 10:40:440001为什么生成式 AI 的创始人之一要全身心投入 Web3?
利亚·波洛苏欣(IlliaPolosukhin)是2017年AI领域具有里程碑意义的论文《AttentionisAllyouNeed》的团队成员之一,共同创造了Transformer模型,为ChatGPT等生成式AI系统提供了支持。站长网2023-08-24 23:45:440000华为与云从科技等共同研发港口大模型PortGPT
近日,在以“数字引领智慧赋能”为主题的2023智慧港口大会上,华为与天津港集团、浙江海港集团、天津超算中心、云从科技共同启动港口大模型PortGPT联合研发。目前,港口大模型PortGPT已初步规划港口生产、物流服务、客户管理、客户服务、视频分析、办公辅助等多个应用场景开展测试,并通过推进PortGPT语言大模型的应用,服务港口企业生产交接班会议和解决天津港通识性问题。站长网2023-10-20 10:26:300000