CamCo:可控制相机的3D 一致图像到视频生成
站长网2024-06-05 16:45:060阅
划重点:
🔍 提供了一个可控制相机姿态的图像到视频生成框架
🔍 引入 Plücker 坐标和极线约束注意力,实现了三维一致性
🔍 通过结构光算法对真实世界视频进行微调,改进了对象运动的合成效果
研究提出了一种新颖的可控制相机姿态的图像到视频生成框架 ——CamCo,用于生成高质量、三维一致的视频。通过引入 Plücker 坐标,为预训练的图像到视频生成器提供了精确参数化的相机姿态输入。
产品入口网址:https://top.aibase.com/tool/camco
为了增强生成的视频的三维一致性,研究人员在每个注意力模块中集成了极线约束注意力模块,以对特征图施加极线约束。此外,通过结构光算法对真实世界视频进行微调,以改进对象运动的合成效果。实验结果表明,与之前的模型相比,CamCo 在三维一致性和相机控制能力方面有显著的改进,同时能够有效地生成合理的对象运动。

CamCo 是一个全新的可控制相机的图像到视频生成框架,可以生成高质量、三维一致的视频。CamCo 通过使用 Plücker 坐标和极线约束注意力块将相机参数注入模型中。研究人员还引入了一个数据筛选流程,用于处理带有动态主体的真实世界视频,并通过这个筛选后的数据集对 CamCo 进行微调,以提高其生成具有相机自我运动和动态主体的视频的能力。
给定一张单独的图片和一个相机序列作为输入,CamCo 模型可以合成符合相机条件并具有三维一致性的视频。我们支持室内、室外、以物体为中心的和文本到图像生成的图片。最后一行的提示为 "一个繁茂的花园,里面有各种颜色的盛开的玫瑰,中间蜿蜒着一条石子路",第一帧的相机姿态以紫色显示。
0000
评论列表
共(0)条相关推荐
暴雪内部推行AI:快速生成游戏美术概念图
快科技6月4日消息,近日,据外媒报道消息,暴雪在内部推出了一款名为BlizzardDiffusion”的生成式图形工具。据悉,这款软件使用了暴雪旗下的游戏内容进行训练,能够快速生成如《魔兽世界》、《暗黑破坏神》等类型游戏的美术概念图。暴雪的联合创始人阿伦亚德翰在一封内部邮件中介绍了这款软件。站长网2023-06-05 19:28:240000中风瘫痪18年,AI让她再次「开口说话」!脑机接口模拟表情,数字化身当嘴替|Nature
【新智元导读】中风后,瘫痪的Ann失语了18年。就在最近,脑机接口和数字化身,竟让她能用面部表情「说话」了。同一天,Nature双发「脑机接口」重磅研究,足以改变整个人类!30岁那年,一次毁灭性的中风,让一位47岁加拿大女性几乎完全瘫痪,此后失语18年。幸运地是,来自加州大学的团队开发了全新脑机接口(BCI),让Ann控制「数字化身」再次开始说话了。站长网2023-08-25 17:23:230000海外游方便了!百度地图国际地图重大更新:热门国家出游笔记全覆盖
快科技8月30日消息,马上就要迎来国庆小长假了,加上国际航班复航率逐步提升、出境跟团游目的地国家扩容,很多人都计划假期海外旅游。今日,百度地图宣布重磅升级国际地图服务,实现热门国家和地区的出游笔记全覆盖,帮助境外游用户提升行前决策效率。据悉,全球国家/城市检索服务全面升级,满足用户浏览心仪目的地的地区概况、风土人情、吃喝玩乐等多类型内容需求,免去在社交软件和地图App中来回比较的麻烦。站长网2023-08-30 18:06:550000谷歌宣布推出Project IDX 提供基于AI的浏览器开发环境
谷歌宣布推出ProjectIDX,这是其进军提供基于AI的浏览器开发环境,用于构建全栈Web和多平台应用的领域。目前,它支持Angular、Flutter、Next.js、React、Svelte和Vue等框架,以及JavaScript和Dart等语言,同时还在开发对Python、Go等其他语言的支持。站长网2023-08-09 10:18:120000人工智能在欺诈检测中的作用:保卫金融安全的强有力工具
随着数字化世界的不断发展,金融交易和商业运营领域也发生了翻天覆地的变化。与此同时,金融欺诈的复杂程度也呈现明显的上升趋势。为了应对这个问题,许多组织开始转向先进的技术手段,而人工智能(AI)被证明是他们武器库中最强大的工具之一。在欺诈检测领域,AI正在革新我们识别和预防金融犯罪的方式。站长网2023-10-30 11:30:240000