研究人员推视频运动控制器MotionCtrl 可有效独立控制摄像机和物体的运动
要点:
MotionCtrl是一种用于视频生成的统一而灵活的运动控制器,能够有效地独立控制摄像机运动和物体运动,实现更精细和多样化的运动控制。
MotionCtrl通过两个模块,即摄像机运动控制模块(CMCM)和物体运动控制模块(OMCM),以及精心设计的架构和训练策略。
通过CMCM和OMCM的独立训练和结合LVDM,MotionCtrl能够在相对有限的数据集上进行训练,并在生成视频时灵活地控制摄像机和物体的运动,展示出较之前方法更为出色的性能。
近年来,视频生成领域取得了显著进展,但对于视频中的摄像机和物体运动的准确控制仍然是一个挑战。传统方法往往集中在其中一种运动类型,或者在两者之间没有明确的区分,从而限制了运动控制的多样性。为了解决这一问题,研究人员开发了一种名为MotionCtrl的技术,可以通过手绘的轨迹来控制摄像机和视频中物体的运动轨迹。该技术还支持Animatediff,希望在开源后能够有相应的节点插件。
MotionCtrl能够独立有效地控制摄像机运动和物体运动,实现更精细和多样化的运动控制。其架构考虑了摄像机运动和物体运动的固有属性,通过CMCM和OMCM模块分别处理这两种运动类型。这使得在生成的视频中可以实现更细致的运动调整,并灵活地组合这两种运动类型,提高了控制的多样性。

论文地址:https://arxiv.org/pdf/2312.03641.pdf
MotionCtrl的运动条件由摄像机姿态和轨迹决定,这些条件与外观无关,最小程度地影响生成视频中物体的外观或形状。这使得MotionCtrl生成的视频在保持物体自然外观的同时,能够准确地反映所给摄像机姿态和轨迹,提高了生成视频的真实感。
MotionCtrl是相对通用的模型,一旦训练完成,能够适应各种摄像机姿态和轨迹,无需对每个摄像机或物体运动进行精细调整。这增强了模型的泛化能力,使其在不同情境下都能表现出色。
该项目的优势在于,它可以有效地独立控制摄像机和物体的运动,实现更精细的运动控制,促进两种类型运动的灵活多样组合。此外,该技术的运动条件由摄像机的姿势和轨迹确定,与视频中物体的外观或形状影响最小。
MotionCtrl的实现方法是通过添加相机运动控制模块(CMCM)和物体运动控制模块(OMCM)来扩展LVDM的去噪U-Net结构。CMCM通过将相机姿态序列RT附加到第二个自注意模块的输入中,并应用一个定制的轻量级全连接层来提取相机姿态特征,将其与LVDM的时间变换器进行集成。
为了训练MotionCtrl,研究人员采用了一种多阶段的训练策略,并使用特定的增强数据集,以满足摄像机运动和物体运动控制的训练需求。对于摄像机运动控制模块(CMCM),研究人员选择了Realestate10K数据集,并通过Blip2生成视频片段的文字描述。对于物体运动控制模块(OMCM),由于缺乏同时包含摄像机姿态、文字描述和物体运动轨迹的综合数据集,研究人员采用了ParticleSfM来生成物体运动轨迹,并通过Gaussian filter进行优化。
实验结果表明,MotionCtrl相对于现有方法在运动控制方面表现出色,具有更高的生成视频质量和更灵活的运动控制能力。
李彦宏:已有10%的大搜流量通过文心一言模型生成
近日,百度创始人、董事长兼首席执行官李彦宏在一场盛大的内部颁奖活动中,向在场的获奖团队和个人致以热烈的祝贺,并深刻阐述了百度对技术的坚定信仰和对未来的美好展望。李彦宏首先强调,百度始终坚信技术拥有改变世界的力量,并会坚定不移地沿着这条路前行。他表示,虽然创新的过程充满了挑战和不确定性,但百度不会因此放弃,而是会不断尝试、不断突破,直至实现技术的价值。站长网2024-05-11 11:35:220000快手双11购物节正式开启预售 “抽免单”活动已上线
10月10日,快手平台正式开启了今年的双11购物节预售活动,以"件件甄选多买多省"为主题,为消费者带来了多样化的优惠活动和低价好物。此次购物节旨在提供丰富的商品选择和连续的促销活动,让消费者在购物过程中享受更多优惠。站长网2024-10-14 18:33:420000微软启动《AI选集》项目 完整版将于6月26日出版
微软今日宣布启动《AI选集》项目,此项目旨在鼓舞人心、探讨利用AI造福人类的多种方式并揭示潜在挑战。该项目收录了20篇由各领域杰出学者和专业人士撰写的文章。获邀参与的每位专家获得了早期保密探访GPT-4的机会。站长网2023-06-01 15:54:540000理想MEGA成全球风阻系数最低MPV 风阻系数仅为0.215
在今天的理想汽车2024春季发布会上,李想自豪地宣布,理想MEGA的实测风阻系数仅为0.215,这一成绩使其成为全球风阻系数最低的MPV。李想进一步解释道,风阻系数对汽车的续航和能耗有着直接的影响。当车辆以80km/h的速度行驶时,整车能耗中有60%-70%是用于克服风阻的,而且随着速度的增加,空气阻力带来的能量损耗也会相应增大。站长网2024-03-01 16:30:290000微信鸿蒙NEXT原生版开始内测邀请 腾讯超20款产品正在积极适配
今日,腾讯宣布,10月8日起,微信为搭载鸿蒙操作系统HarmonyOSNEXT的用户提供原生应用内测邀请,用户在系统升级后将有机会率先体验这一新版本。这个微信“尝鲜版”集成了核心的社交通讯功能、音视频通话、朋友圈浏览,以及微信支付的二维码收付款等常用功能。0000