英伟达出品!文生图模型TrailBlazer:利用边界框控制视频对象轨迹
划重点:
🔍 该论文介绍了一种使用边界框来引导视频合成的方法,实现了视频的可控性。
🔍 通过简单的边界框引导,可以实现对视频中物体轨迹和外观的控制。
🔍 TrailBlazer 算法基于预训练模型,无需进一步训练、微调或在线优化。
在最近的文本到视频生成(T2V)方法中,实现合成视频的可控性通常是一个挑战。通常情况下,为了解决这个问题,需要提供低级别的每帧指导,如边缘图、深度图或待修改的现有视频。然而,获取这样的指导可能需要大量的劳动力,并且限制于现有视频会限制创造力。
TrailBlazer是英伟达的一个预训练好的模型,他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为,而无需使用现有视频或在推理时进行神经网络训练、微调或优化。例如,你可以通过改变边界框的大小、方向,让视频中的对象看起来更接近或更远离,也可以控制移动方向。

TrailBlazer 算法基于预训练的 T2V 模型构建,易于实现。通过边界框来引导物体,在空间和时间上进行注意力图编辑。
此外,TrailBlazer支持通过对移动的边界框和相应提示进行关键帧设置,来指导物体的轨迹和外观,无需提供详细的掩码。该方法非常高效,与底层预训练模型相比,附加计算量几乎可以忽略不计。尽管边界框引导的简单性,生成的运动令人惊讶地自然,出现了透视和随着边界框尺寸增大而向虚拟相机移动的效果。
TrailBlazer 还支持通过关键帧设置来动画化边界框和提示,使用户能够在时间轴上改变物体的轨迹和粗略行为。生成的物体与指定的环境无缝衔接,为非专业用户提供了一个可行的视频叙事流程。

TrailBlazer 算法有一些局限性,其中包括继承了底层预训练模型(ZeroScope)的限制,如动物的错误肢体数目等问题,这些问题在许多基于扩散的 T2I 和 T2V 方法中普遍存在。
TrailBlazer的主要功能特点如下:
1. 文本到视频扩散(text-to-video diffusion):使用预训练模型进行视频编辑,无需进一步的模型训练、微调或在线优化。
2. 支持控制多个对象:如果视频中有多个人物或物体,TrailBlazer允许您同时控制它们的动作,这对于创造复杂的场景非常有用。
3. 利用简单的边界框进控制对象:通过使用简单的边界框来指导主题的运动,而无需使用预先存在的视频或在推理时进行神经网络训练、微调或优化。
4. 关键帧动画:可以在视频中设置“关键帧”,在这些关键帧上定义对象的位置和动作。
5. 高效且自然的运动生成:尽管使用简单的边界框进行指导,TrailBlazer生成的运动效果仍然非常自然,包括透视效果和随着边界框大小增加向虚拟摄像机移动等出现的效果。
项目演示网址:https://top.aibase.com/tool/trailblazer
论文网址:arxiv.org/abs/2401.00896
轻松识别Midjourney等AI生成图片,开源GenImage
AIGC时代,人人都可以使用Midjourney、StableDiffusion等AI产品生成高质量图片,其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响,例如,生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈,造成信任危机等。站长网2024-01-16 10:08:200000AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
两个AI现场攻防,翻车了人类就在旁边“蛐蛐”。现在的AI比赛真是越来越因吹斯汀了。这不,一个拿着“花开富贵”大姨人设的Agent直接甩了个链接,对面的AI客服就开始大段大段冗长回复,几个回合都是如此。围观人类一点儿都不留情面,马上锐评:我都看不下去这么长的回复,不擅长网购的“阿姨”能有这样的耐心?可能看不到一半就走了。遇到妙语连珠的,人类也纷纷爆灯。站长网2024-09-23 21:39:340000苹果 iOS 17 引入新功能:可通过「敏感内容警告」自动阻止未经允许的裸露内容
苹果在iOS17中增加了一个新功能,旨在自动屏蔽可能包含裸露等敏感内容的传入信息和文件。用户可以选择使用模糊功能来处理通过信息、AirDrop、电话应用程序的联系人海报、FaceTime信息和第三方应用发送的敏感图片。该功能将阻止成年iPhone用户接收到不需要的图像。所有裸露图片都将被屏蔽,但用户可以通过点击「显示」按钮来查看。站长网2023-06-08 13:35:470000新闻行业高管对谷歌 AI 「搜索生成体验」的影响表示担忧:近 40% 的流量来自谷歌
据《华尔街日报》(WSJ)周四(12月14日)报道,谷歌将其「搜索生成体验」人工智能(AI)工具整合进搜索功能,突显了媒体公司依赖这家科技巨头将其报道传达给读者所面临的风险。0000理想汽车推出9周年庆限时购车政策 至高可享1.7万元购车礼
为庆祝公司成立九周年的辉煌时刻,理想汽车精心策划了一场盛大的庆典活动。自7月1日起至7月15日,凡是在此期间定购理想L6、L7、L8、L9及旗舰车型理想MEGA的消费者,均可尊享高达1.7万元的限时购车大礼包,并享受优惠的金融政策,让购车梦想触手可及。此次购车优惠不仅彰显了理想汽车对消费者的深厚回馈之情,也进一步巩固了其在新能源汽车市场的领先地位。站长网2024-07-02 18:04:570000