Meta AI提出视频抠图新方法OmnimatteRF:结合动态2D前景图层和3D背景模型
要点:
马里兰大学和Meta AI研究人员提出视频抠图新方法OmnimatteRF,同时利用2D前景图层和3D背景模型。
2D前景图层记录运动物体及影响,3D背景模型适用于复杂几何和非旋转摄像运动,扩展适用视频种类。
在两个视频数据集上,与先前方法相比,该方法取得更好表现,无需每个视频单独参数调整。
Omnimatte是迄今为止最有前景的视频抠图方法。它使用单应性建模背景,因此只适用于背景为平面或仅有旋转运动的视频。D2NeRF通过独立建模场景的动态和静态成分,使用两个辐射场来解决这个问题。它在复杂的大范围运动场景中表现强劲,不需要任何遮挡输入,完全自监督。但是如何融合视频中的2D guidance尚不清楚。
项目地址:https://github.com/facebookresearch/OmnimatteRF
马里兰大学和Meta AI的最新研究提出一种集两者优点于一体的方法,使用3D背景模型与2D前景层。2D前景层表示难以用3D建模的物体、动作和效果。3D背景建模可以处理复杂几何形状和非旋转摄像机运动,扩展适用的视频种类。该方法称为OmnimatteRF。在两个视频数据集上的实验表明,它在各种视频上都有出色表现,无需针对每个视频调参。
OmnimatteRF能够分离前景中的主体部分和背景场景。它使用二维层保留主体的细节,同时利用三维背景模型对复杂场景进行重建。相比仅使用二维图像层表示视频背景的方法,三维建模极大地提升了对真实世界视频的适应能力。
该方法首先使用传统视频遮罩技术分离出动态的前景层。然后,利用这些遮罩结果和单目深度估计,训练一个表征背景的神经辐射场模型TensoRF。最后,将动态前景层和静态三维背景模型联合,重建复杂的真实场景。
研究者在各类真实视频上进行了大量试验,结果证明相比仅使用二维层的方法,OmnimatteRF能够得到更优质的重建效果。该技术对视频制作专业人员具有重要应用价值,可用于拍摄的影片中添加有趣的效果。同时,它也可助力构建沉浸式的虚拟环境。
首个ChatGPT版网站开发平台dora AI上线,输入文本3分钟生成一个网站
要点:1、首个生成式AI网站开发平台doraAI全面开启公测,用户通过文本提示快速开发网站,平均3分钟一站点。2、doraAI与传统模版不同,每个页面根据用户文本提示生成,可视化编辑操作简单高效。3、doraAI提供免费试用,用户通过文本提示快速创建商务、科技、营销等多种类型网站。站长网2024-03-21 19:15:440001Anthropic反击音乐发行商禁令动议:使用受版权保护的内容作为LLM训练数据是合理的
**划重点:**1.📜两个月前,包括环球音乐、康科德和ABKCO在内的音乐发行商要求对Anthropic提出初步禁令,指控其在版权诉讼中侵权。2.🤝Anthropic回应指出,使用受版权保护的内容作为LLM训练数据是合理使用,拒绝禁令请求,并表示原告未在发现所谓不可挽回的错误的数月内通知他们。站长网2024-01-24 11:09:500000大翻车!斯坦福超火机器人自曝内幕,研究者救场还受伤了,网友:放心了
爆火的斯坦福全能家务机器人MobileALOHA,大!翻!!车!!!你以为它擦个红酒轻而易举,但实际上却是这样的:全给你弄撒喽,顺带碎个杯子……你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底:MobileALOHA的翻车大合集还不止这些。例如刚才炒完虾的锅,哎呦喂,一不小心没拿住:即使小哥一个箭步冲上去也没阻止“悲剧”的发生(好像还烫到手了)。0001生成超清分辨率视频,南洋理工开源Upscale-A-Video
大模型在生成高质量图像方面表现出色,但在生成视频任务中,经常会面临视频不连贯、图像模糊、掉帧等问题。这主要是因为生成式抽样过程中的随机性,会在视频序列中引入无法预测的帧跳动。同时现有方法仅考虑了局部视频片段的时空一致性,无法保证整个长视频的整体连贯性。0000特斯拉股价大涨22% 马斯克身家一夜猛增2385亿人民币
特斯拉股价在10月24日大涨近22%,市值一夜之间增加了约1496亿美元(约合人民币10651亿元)。这一涨幅创下了自2013年5月以来的最大单日涨幅记录。特斯拉的强劲表现也使得持有公司超过20%股份的CEO埃隆·马斯克的个人财富一夜之间增加了约335亿美元(约合人民币2385亿元)。站长网2024-10-25 08:28:270000