李飞飞团队推零样本360度场景合成技术ZeroNVS
要点:
1. 斯坦福和谷歌团队提出了ZeroNVS,一种能够从单个图像实现零样本360度试图合成的新技术。
2. ZeroNVS利用3D感知扩散模型和SDS蒸馏来生成逼真且多样化的合成图像,聚焦于场景而不是物体。
3. 研究人员使用不同的基准数据集进行评估,结果表明ZeroNVS在零样本性能方面明显领先于其他方法,特别是在LPIPS指标上。
斯坦福和谷歌团队提出了一项名为ZeroNVS的创新技术,能够从单个图像实现零样本360度试图合成。过去,3D感知扩散模型的训练主要集中在模型生成单个物体的SDS蒸馏上,但要生成逼真且多样化的合成图像,需要关注整个场景。ZeroNVS的方法涉及使用高质量大规模数据集,如Objaverse-XL,以实现从新视角生成逼真图像,然后通过SDS蒸馏采样,提高3D一致性。与以往的工作不同,ZeroNVS聚焦于场景,而不是物体,因为背景对于图像多样性至关重要。
在具体方法上,研究人员首先训练扩散模型,然后使用它来执行新颖的视图合成,随后进行3D SDS蒸馏。与以往不同的是,ZeroNVS引入了一种具有六个自由度的相机表示,以捕获所有可能的位置和方向。这种表示被称为“6DoF 1”,它对于场景的刚性变换具有不变性。此外,研究人员还通过“SDS anchoring”来提高多样性,使用DDIM对新视图进行采样,然后使用最近的图像作为指导。

论文地址:https://arxiv.org/pdf/2310.17994.pdf
在实验结果方面,研究人员使用了一组标准的新视图合成指标来评估各种方法,主要关注LPIPS。结果显示,ZeroNVS在零样本性能方面明显领先于其他方法,包括DS-NeRF、PixelNeRF等。此外,研究人员还引入了Mip-NeRF360数据集,来进一步测试单张图像的360度视图合成任务,结果仍然显示ZeroNVS表现出色。
总之,ZeroNVS是一项创新的技术,可以从单个图像生成多样的合成图像,聚焦于场景级的合成。它利用3D感知扩散模型和SDS蒸馏,采用新的相机表示和“SDS anchoring”来提高性能,从而在零样本性能方面取得显著成果。这一技术有望在计算机视觉和图像合成领域产生重要影响。
魅族推出AR眼镜MYVU Discovery 售价9999元
魅族在今日的2023魅族秋季无界生态发布会上推出了旗舰AR眼镜MYVUDiscovery,售价9999元,首发搭载了FlymeAR系统。这款眼镜的设计由魅族20INFINITY的设计团队负责,采用了“SCULPTDESIGN设计语言”,并大量运用了汽车设计中常用的“连续曲率元素”。同时,他们也将“人因工程”引入了AR眼镜的设计与制造环节,针对亚洲人脸型做到了毫米级的适配。站长网2023-11-30 15:21:190000戴珊携淘天背水一战
争夺定价权。2023年的双十一,阿里、京东、拼多多、抖音、快手、小红书……,中国几乎所有电商巨头都加入了低价竞争的行列。这样的拼杀,是中国互联网江湖从未有过的景象。全天候科技将借此呈现这个战场中多家公司的切面,观察和预测行业的发展和走向。站长网2023-11-01 17:48:320001董宇辉与辉同行30天卖了7个亿:粉丝增长超130万
自董宇辉7月25日宣布独立运营以来,"与辉同行"项目在短短一个月内取得了显著成绩。根据第三方数据,该账号粉丝增长超过130万,总数已突破2300万大关。同时,董宇辉个人账号的粉丝数也增加了50多万,接近2700万。站长网2024-08-31 16:11:170001随着无人机交通量增加,研究者利用AI帮助避免碰撞
文章概要:预计未来几年低空无人机交通量会大幅增加,到2027年美国商用无人机将达100万架。霍普金斯大学研究团队利用AI模拟了一个系统,通过一定程度的自动化决策来更安全地指挥无人机交通。模拟结果表明,碰撞避免算法和策略冲突解除算法可大大减少事故发生,使系统更安全。站长网2023-10-10 09:54:490000羊驼进化成鲸鱼,Meta把对齐「自动化」,Humpback击败现有全部LLaMa模型
数据质量很重要。这一年来,以ChatGPT和GPT-4为代表的大语言模型(LLM)发展迅速,紧随其后,Meta开源的LLaMa、Llama2系列模型在AI界也引起的了不小的轰动。但随之而来的是争议不断,有人认为LLM存在一些不可控的风险,给人类生存构成一些潜在威胁。站长网2023-08-16 14:12:580000