CamCo:可控制相机的3D 一致图像到视频生成
站长网2024-06-05 16:45:060阅
划重点:
🔍 提供了一个可控制相机姿态的图像到视频生成框架
🔍 引入 Plücker 坐标和极线约束注意力,实现了三维一致性
🔍 通过结构光算法对真实世界视频进行微调,改进了对象运动的合成效果
研究提出了一种新颖的可控制相机姿态的图像到视频生成框架 ——CamCo,用于生成高质量、三维一致的视频。通过引入 Plücker 坐标,为预训练的图像到视频生成器提供了精确参数化的相机姿态输入。
产品入口网址:https://top.aibase.com/tool/camco
为了增强生成的视频的三维一致性,研究人员在每个注意力模块中集成了极线约束注意力模块,以对特征图施加极线约束。此外,通过结构光算法对真实世界视频进行微调,以改进对象运动的合成效果。实验结果表明,与之前的模型相比,CamCo 在三维一致性和相机控制能力方面有显著的改进,同时能够有效地生成合理的对象运动。
CamCo 是一个全新的可控制相机的图像到视频生成框架,可以生成高质量、三维一致的视频。CamCo 通过使用 Plücker 坐标和极线约束注意力块将相机参数注入模型中。研究人员还引入了一个数据筛选流程,用于处理带有动态主体的真实世界视频,并通过这个筛选后的数据集对 CamCo 进行微调,以提高其生成具有相机自我运动和动态主体的视频的能力。
给定一张单独的图片和一个相机序列作为输入,CamCo 模型可以合成符合相机条件并具有三维一致性的视频。我们支持室内、室外、以物体为中心的和文本到图像生成的图片。最后一行的提示为 "一个繁茂的花园,里面有各种颜色的盛开的玫瑰,中间蜿蜒着一条石子路",第一帧的相机姿态以紫色显示。
0000
评论列表
共(0)条相关推荐
腾讯西湖大学共同申请问答模型专利
天眼查App显示,近日,腾讯科技(深圳)有限公司与西湖大学共同申请的“语句生成方法、装置以及计算机可读存储介质”专利公布。站长网2023-07-04 00:15:470000对公司信心不足 Meta流失三分之一AI研究人员
据报道,Meta的首席执行官马克·扎克伯格过去曾经大量投资于人工智能领域。但是随着裁员以及其中大量研究人员的离职,这个科技巨头在人工智能领域已经开始落后于竞争对手。站长网2023-06-20 16:11:180000S&P 500 的命运越来越依赖于几家大型科技公司能否将人工智能投资转化为更高的利润
:在S&P500(标普500)指数今年的上涨中,包括微软公司和英伟达公司在内的七家公司推动了大约四分之三的涨幅。这场由投资者对人工智能改变经济的巨大潜力所引发的热潮,使得这些公司的估值居高不下,其股票平均市盈率达到32倍。随着这些股价不断攀升,这些公司需要兑现市场对其盈利前景的期望。0000元乘象ChatImg大模型完成千万元天使轮融资
近日,多模态大模型初创企业“智子引擎”宣布完成千万元天使轮融资,旗下拥有参数规模约150亿的大模型“元乘象ChatImg”,关注微信公众号“元乘象”即可体验。该模型的训练集主要包括图文对数据和视觉问答(VQA)数据,已经在图文匹配、图文检索、图像描述生成和文本描述生成等多个任务上进行了训练,表现出了出色的多模态处理能力。站长网2023-05-23 11:17:010000刷题狂魔大喜!AI 刷题工具chatTests带你轻松通关
chatTests是一个基于OpenAIGPT3.5模型的AI刷题和辅导项目,该项目在DataWhale5月GPT应用开发Hackathon比赛中获得了最高分,并斩获了最佳创新奖和最佳应用奖两个最佳奖项。项目体验地址:https://yfor-chattests.hf.space/index.html#/站长网2023-07-20 17:41:410000