字节发布视频控制方式Boximator 比Runway运动笔刷更精确
站长网2024-02-06 09:31:251阅
字节研究院发布了一个名为Boximator的视频控制方式,看起来相当不错。这种控制方式允许用户选择需要运动的物体,并绘制其结束位置和运动路径,物体将严格按照用户绘制的位置和路径进行运动。与Runway的运动笔刷相比,Boximator可以更精确地控制物体的运动结束位置。
项目地址:https://top.aibase.com/tool/boximator
Boximator采用了硬性约束和软性约束两种约束机制。用户可以通过硬性约束选择视频中特定对象的条件帧,并通过这两种约束方式来指定该对象在未来画面中的位置、形状或运动轨迹。Boximator可以作为现有视频合成模型的一个附加组件。
在训练过程中,为了保留原模型的知识,研究院选择冻结了原始权重,只对控制模块进行训练。引入创新的自我追踪技术,简化了学习框选对象与其关联的过程。
实验证明,Boximator在视频质量方面达到了行业领先水平,相较于基础模型有所提升,并在引入框选约束后进一步增强了效果。人类评估显示,用户更喜欢Boximator生成的视频效果,而不是基础模型的输出。
0001
评论列表
共(0)条相关推荐
猿辅导推出小猿学练机 正式入局1000亿智能硬件市场
猿辅导沉寂两年之后,在智能硬件领域重磅推出旗舰型产品——小猿学练机。该产品针对全国中小学生,注重学习和练习的结合,以及数字化学习的产品体系,配备封闭式系统和10.3寸类纸墨水屏,重定义了学习和练习的全新模式。这次动作也标志着猿辅导正式进入1000亿智能硬件市场。站长网2023-05-30 15:06:330000华为盘古大模型3.0发布,聚焦行业应用
华为盘古大模型3.0在最近举行的华为开发者大会2023(Cloud)上正式推出。据悉,该大模型系列面向行业应用,采用了包括5NX三层架构在内的创新技术,旨在通过行业重塑、技术扎根和开放合作等方面,不断提升华为的核心竞争力,推动千行百业的重塑。站长网2023-07-10 00:07:300001UIUC华人团队揭秘代码集成到LLM训练数据中的好处
要点:1.代码预训练提升LLM在推理能力上的表现,能应用于更复杂的自然语言任务。2.代码生成结构化的中间步骤,可以通过函数调用连接到外部执行终端。3.利用代码编译和执行环境提供了更多样化的反馈信号,为模型的进一步改进提供支持。站长网2024-01-29 09:39:230000年薪百万美元、马斯克直呼“史上最疯狂”!大厂“AI人才战”爆发
快科技4月6日消息,近日特斯拉CEO马斯克在社交平台上发布了一系列帖子称,OpenAI正在以高薪诱惑特斯拉工程师,并且他们在某些情况下取得了成功。马斯克表示这是我见过最疯狂的人才战争”,并宣布将提高AI工程师的薪酬。AI的快速发展也加剧了科技巨头间的竞争,AI人才更是成为争抢的重中之重,能够吸引和保留AI人员也被视为科技巨头们成功的关键因素之一。站长网2024-04-18 14:28:360000美国法院否认AI图像版权,但这一裁决意义不大
AI发明家StephenThaler试图对人工智能生成的内容实施版权保护,但再次失败。美国地区法官BerylA.Howell在上周裁决中表示,AI图像无法获得版权,维持了美国版权局在2022年2月的意见,认为Thaler的AI图像《最近进入天堂的场景》不适用版权法保护。站长网2023-08-21 14:36:330000