英伟达出品!文生图模型TrailBlazer:利用边界框控制视频对象轨迹
划重点:
🔍 该论文介绍了一种使用边界框来引导视频合成的方法,实现了视频的可控性。
🔍 通过简单的边界框引导,可以实现对视频中物体轨迹和外观的控制。
🔍 TrailBlazer 算法基于预训练模型,无需进一步训练、微调或在线优化。
在最近的文本到视频生成(T2V)方法中,实现合成视频的可控性通常是一个挑战。通常情况下,为了解决这个问题,需要提供低级别的每帧指导,如边缘图、深度图或待修改的现有视频。然而,获取这样的指导可能需要大量的劳动力,并且限制于现有视频会限制创造力。
TrailBlazer是英伟达的一个预训练好的模型,他们提出一个边界框的概念,来控制视频对象的运动方向、速度和行为,而无需使用现有视频或在推理时进行神经网络训练、微调或优化。例如,你可以通过改变边界框的大小、方向,让视频中的对象看起来更接近或更远离,也可以控制移动方向。
TrailBlazer 算法基于预训练的 T2V 模型构建,易于实现。通过边界框来引导物体,在空间和时间上进行注意力图编辑。
此外,TrailBlazer支持通过对移动的边界框和相应提示进行关键帧设置,来指导物体的轨迹和外观,无需提供详细的掩码。该方法非常高效,与底层预训练模型相比,附加计算量几乎可以忽略不计。尽管边界框引导的简单性,生成的运动令人惊讶地自然,出现了透视和随着边界框尺寸增大而向虚拟相机移动的效果。
TrailBlazer 还支持通过关键帧设置来动画化边界框和提示,使用户能够在时间轴上改变物体的轨迹和粗略行为。生成的物体与指定的环境无缝衔接,为非专业用户提供了一个可行的视频叙事流程。
TrailBlazer 算法有一些局限性,其中包括继承了底层预训练模型(ZeroScope)的限制,如动物的错误肢体数目等问题,这些问题在许多基于扩散的 T2I 和 T2V 方法中普遍存在。
TrailBlazer的主要功能特点如下:
1. 文本到视频扩散(text-to-video diffusion):使用预训练模型进行视频编辑,无需进一步的模型训练、微调或在线优化。
2. 支持控制多个对象:如果视频中有多个人物或物体,TrailBlazer允许您同时控制它们的动作,这对于创造复杂的场景非常有用。
3. 利用简单的边界框进控制对象:通过使用简单的边界框来指导主题的运动,而无需使用预先存在的视频或在推理时进行神经网络训练、微调或优化。
4. 关键帧动画:可以在视频中设置“关键帧”,在这些关键帧上定义对象的位置和动作。
5. 高效且自然的运动生成:尽管使用简单的边界框进行指导,TrailBlazer生成的运动效果仍然非常自然,包括透视效果和随着边界框大小增加向虚拟摄像机移动等出现的效果。
项目演示网址:https://top.aibase.com/tool/trailblazer
论文网址:arxiv.org/abs/2401.00896
瞄准“富贵闲人”,2款社交App月入百万美金
今年年初,TikTok在美国遭遇被禁风波,连带反应就是多个TikTok替代品下载量飙升。这些App自然都没有在榜单上停留太久,但编辑部近日发现,年初靠“TikTok替代品”热度短暂冲榜的Clapper,虽然在下载榜已经完全捞不起来了,但收入却在快速增长后依然保持稳定。ClapperApp页面站长网2023-11-09 09:02:560000特斯拉:Model Y全轮驱动长续航版涨价2000元
据特斯拉中国官方消息,今日,特斯拉中国宣布,ModelY全轮驱动长续航版上调2000元至30.44万元。此前,特斯拉中国多次宣布旗下车型涨价。11月14日,特斯拉中国宣布,Model3/Y后轮驱动版的售价正式上调。Model3后轮驱动版的售价上涨1500元,现价为26.14万元;而ModelY后轮驱动版的售价上涨2500元,现价为26.64万元。站长网2023-11-21 08:45:170000娱乐巨头CAA 推出人工智能克隆保护服务 帮助明星管理数字遗产
CreativeArtistsAgency(CAA)正在为其明星客户开发一个虚拟媒体存储系统,用于保护他们的数字资产,包括姓名、图像、数字扫描和录音。这一新项目是该公司工作室"theCAAvault"的一部分,让演员可以使用扫描技术记录自己的身体、面部、动作和声音,以创建人工智能克隆人。站长网2024-05-20 12:20:250000Meta全新纯C++分割引擎SAM.cpp 支持图像、视频等精细分割
Meta公司最新研发的SAM.cpp项目现已在GitHub仓库中开源。这是一项运行于纯C环境下的分割技术,其底层驱动是GGML。SAM.cpp能够实现Meta上的任何内容的精细分割,不论是图像、视频,还是复杂的3D模型,都能够轻松应对。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-09-07 11:35:510000鸿蒙原生App已在Mate60 Pro等麒麟机型上测试
华为在HarmonyOSNEXT开发者预览版的适配工作上取得了显著进展。据数码闲聊站最新爆料,几大主流平台已经完成适配。目前,华为正在Mate40Pro/Mate60Pro等麒麟芯片机型上进行测试,这些测试基于OpenHarmony4.X版本。值得注意的是,鸿蒙原生App已经进入了实际测试阶段,这意味着下一代HarmonyOS将能够使用独立的App。站长网2023-12-27 10:08:570000