Stability AI推出视频生成模型Stable Video Diffusion
**划重点:**
1. 🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion,基于其现有的Stable Diffusion文本转图像模型,可通过动画化现有图像生成视频。
2. ⚠️ 模型目前处于“研究预览”阶段,使用者需同意特定使用条款,限制其应用于“教育或创意工具”等领域,禁止用于“真实事件或人物的表现”。
3. 💰 Stability AI计划商业化应用,已筹集超过1.25亿美元资金,但面临财务困境和高烧钱速度。公司前高管离职,曾提出更严格的版权使用方针。
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Diffusion在开源领域提供了少数几个视频生成模型之一。

然而,需要注意的是,该模型目前处于“研究预览”阶段,使用者必须同意特定的使用条款,明确规定了其预期应用领域,如“教育或创意工具”等,同时禁止用于“真实事件或人物的表现”。考虑到过去类似AI研究预览的历史,有可能该模型很快会在暗网上流传,引发对其滥用的担忧,特别是因为它似乎没有内置的内容过滤器。
Stable Video Diffusion提供两个模型,分别为SVD和SVD-XT。其中,SVD将静止图像转换为14帧的576x1024视频,而SVD-XT在相同的架构下将帧数提升至24。这两者都能以每秒3到30帧的速度生成视频。白皮书显示,这两个模型最初在数百万个视频的数据集上进行训练,然后在数十万到百万数量级的较小数据集上进行“微调”。
模型生成的四秒视频片段质量相当高,被认为在某些方面可以与Meta、Google以及其他AI初创公司的视频生成模型相媲美。然而,Stable Video Diffusion存在一些局限性,例如不能生成没有运动或慢速摄像机移动的视频,无法通过文本控制,不能呈现文本(至少不能清晰可辨认),也不能一致地生成面部和人物。
尽管存在这些局限性,Stability AI指出这些模型是相当可扩展的,并可适应生成物体的360度视图等用例。公司计划推出“一系列”建立在SVD和SVD-XT基础上并扩展其功能的模型,以及一款将文本提示引入网络模型的“文本到视频”工具。最终目标是商业化,认为Stable Video Diffusion在“广告、教育、娱乐等领域都具有潜在应用”。
然而,Stability AI目前面临财务问题。据报道,公司最近通过可转债筹集了2500万美元,使其总融资达到1.25亿美元。但是,公司并未以更高的估值完成新一轮融资,最后一次估值为10亿美元。Stability AI曾计划在未来几个月内寻求四倍于此的估值,尽管公司收入较低,烧钱速度较高。
在这一时期,Stability AI还面临一次高管离职。公司副总裁Ed Newton-Rex在一份公开信中表示,他因对如何使用版权数据进行争论而离开了公司。这也是公司面临的另一次挫折,因为Newton-Rex曾在稳定AI音乐生成工具Stable Audio的推出中扮演了关键角色。
官方演示视频: https://www.youtube.com/watch?v=G7mihAy691g
超850万人观看,江歌妈妈直播带货,不“卖惨”
10月7日,江歌妈妈发布一条视频,“小伙伴们,我想做直播带货了”。视频刚发布不久,微博热搜相关词条“江歌妈妈直播带货”阅读量突破2亿,引发了不少网友的激烈讨论。而从10月9日的直播间情况来看,这场持续3小时的直播不卖惨,只卖货,全程吸引超过850万人次观看,整场直播的销售额在100万元—250万元之间。站长网2023-10-12 14:01:340000iPhone16电池或更易更换:采用金属外壳设计
随着欧盟去年通过一项重要法律,要求手机厂商确保到2025年智能手机的电池能够方便用户自行更换,科技巨头苹果正积极响应这一政策,并着手研发新的电池更换技术。据悉,苹果正在开发一种名为电感应粘合剂脱粘技术的创新方案。这一技术允许用户通过施加一小股电流,即可轻松将电池从手机底盘上分离。此举将极大简化电池更换流程,为用户提供了前所未有的便利。站长网2024-06-28 17:21:480000李国庆喊话宗馥莉:格局要大 以和为贵
近日,娃哈哈与农夫山泉之间的争议成为了公众关注的焦点。针对此事,李国庆于3月12日发布了一段视频,表达了他对这两个企业的看法。在视频中,李国庆首先强调了两个企业取得今天这样的成绩都不容易。他认为,无论是娃哈哈还是农夫山泉,都经历了无数的挑战和困难,才能够在市场上站稳脚跟。站长网2024-03-13 11:17:360000伦敦证券交易所正与微软合作 创建定制的生成式AI模型
据FINANCIALTIMES消息,伦敦证券交易所集团正在与微软和多家银行合作,创建定制的生成式人工智能模型,这显示了金融服务业正在寻求利用这项技术,而不暴露自己的专有数据。OpenAI去年推出的ChatGPT引发了对生成式AI的浓厚兴趣,虽然许多金融服务公司对其潜在的好处感兴趣,但他们不愿意在模型中输入机密信息,因为这些模型会不断地从输入的数据中学习。站长网2023-08-04 09:50:490000每秒生成110张图像!StreamDiffusion开源 实时图像生成更强了
StreamDiffusion是一个开源项目,最近在推特上引起了热烈讨论。这个项目基于LCM和SDXLTurbo技术,每秒能够生成110张图像,为想要开发实时图像生成产品的人提供了一个值得关注的资源。这个项目主要是为了实时图像生成服务而设计的,并且在性能方面提供了显著的增强。项目地址:https://github.com/cumulo-autumn/StreamDiffusion站长网2023-12-22 11:27:460006