支持Animatediff所有控制方式!AnimateLCM 4步推理即可生成视频
站长网2024-02-02 17:06:311阅
又有团队开卷视频生成了!这个项目在视频生成方面非常优秀。它使用了一致性模型(Consistency Model, CM)的启发,简化了预训练的图像扩散模型以加速采样过程。这一模型还成功扩展到了潜在一致性模型(Latent Consistency Model, LCM),用于条件图像生成,最终形成了AnimateLCM。
项目地址:https://top.aibase.com/tool/animatelcm
AnimateLCM能够在很少的步骤中生成高质量的视频。相比直接在原始视频数据集上应用一致性学习,该项目提出了一种解耦的一致性学习策略,分别对图像生成的基础知识和运动生成的基础知识进行提炼。这种策略提高了训练效率并提升了生成视频的视觉质量。
此外,为了结合稳定扩散社区中的即插即用适配器来实现各种功能,比如使用ControlNet进行可控制的视频生成,该项目提出了一种高效的策略。这个策略不仅可以将现有的适配器调整到文本条件视频一致性模型中,还可以从零开始训练适配器,而不会影响采样速度。
在基于图像的视频生成和基于布局的视频生成中,AnimateLCM都取得了优异的成绩。从演示来看视频效果也很不错,支持现有 SD 生态 Animatediff 的所有控制方式,将LCM用在视频生成只需要4步推理就可以生成视频。目前,AnimateLCM暂未发布代码和权重,期待能够尽快上代码。
0001
评论列表
共(0)条相关推荐
马斯克豪掷40亿训Grok-3,红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
马斯克为Grok3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。硅谷大厂的人工智能军备竞赛,还在加剧。站长网2024-07-08 11:07:400000谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别
划重点:⭐谷歌AI发布MathWriting数据集,为在线手写数学表达提供230k人工编写和400k合成样本,成为ME识别新标杆⭐MathWriting数据集比CROHME23具有更多样本和标签,包括广泛的数学符号和语法标记⭐MathWriting支持训练模型、评估性能,并提供未来发展方向的参考站长网2024-04-24 14:12:340000Gemini自曝中文用百度文心一言训练,网友看呆:大公司互薅羊毛??
谷歌Gemini中文语料疑似来自文心一言???先是有读者向我们爆料:在谷歌VertexAI平台使用该模型进行中文对话时,Gemini-Pro直接表示自己是百度语言大模型。很快,有微博大V@阑夕夜也发博称:在Poe平台上对Gemini-Pro进行了一个测试。问它“你是谁”,Gemini-Pro上来就回答:我是百度文心大模型。0000Automattic CEO严厉批评 WP Engine 称其为“WordPress 的毒瘤”
Automattic首席执行官兼WordPress联合创始人马特·穆伦维格本周对竞争对手发起了严厉批评,称WPEngine是“WordPress的毒瘤”。0002Canva上线多个好用的AI设计功能:文本生成插画、自动剪辑视频精华片段
设计平台Canva推出了一系列更新,旨在使其设计生态系统对专业团队和工作空间更具吸引力。该公司重新设计了平台,使新的和现有的编辑工具更易于找到,并宣布推出企业版,为大型组织提供更多的协作、品牌管理和安全性控制。站长网2024-05-27 19:47:140000