Stability AI推出视频生成模型Stable Video Diffusion
**划重点:**
1. 🎥 Stability AI发布开源的视频生成模型Stable Video Diffusion,基于其现有的Stable Diffusion文本转图像模型,可通过动画化现有图像生成视频。
2. ⚠️ 模型目前处于“研究预览”阶段,使用者需同意特定使用条款,限制其应用于“教育或创意工具”等领域,禁止用于“真实事件或人物的表现”。
3. 💰 Stability AI计划商业化应用,已筹集超过1.25亿美元资金,但面临财务困境和高烧钱速度。公司前高管离职,曾提出更严格的版权使用方针。
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Diffusion在开源领域提供了少数几个视频生成模型之一。
然而,需要注意的是,该模型目前处于“研究预览”阶段,使用者必须同意特定的使用条款,明确规定了其预期应用领域,如“教育或创意工具”等,同时禁止用于“真实事件或人物的表现”。考虑到过去类似AI研究预览的历史,有可能该模型很快会在暗网上流传,引发对其滥用的担忧,特别是因为它似乎没有内置的内容过滤器。
Stable Video Diffusion提供两个模型,分别为SVD和SVD-XT。其中,SVD将静止图像转换为14帧的576x1024视频,而SVD-XT在相同的架构下将帧数提升至24。这两者都能以每秒3到30帧的速度生成视频。白皮书显示,这两个模型最初在数百万个视频的数据集上进行训练,然后在数十万到百万数量级的较小数据集上进行“微调”。
模型生成的四秒视频片段质量相当高,被认为在某些方面可以与Meta、Google以及其他AI初创公司的视频生成模型相媲美。然而,Stable Video Diffusion存在一些局限性,例如不能生成没有运动或慢速摄像机移动的视频,无法通过文本控制,不能呈现文本(至少不能清晰可辨认),也不能一致地生成面部和人物。
尽管存在这些局限性,Stability AI指出这些模型是相当可扩展的,并可适应生成物体的360度视图等用例。公司计划推出“一系列”建立在SVD和SVD-XT基础上并扩展其功能的模型,以及一款将文本提示引入网络模型的“文本到视频”工具。最终目标是商业化,认为Stable Video Diffusion在“广告、教育、娱乐等领域都具有潜在应用”。
然而,Stability AI目前面临财务问题。据报道,公司最近通过可转债筹集了2500万美元,使其总融资达到1.25亿美元。但是,公司并未以更高的估值完成新一轮融资,最后一次估值为10亿美元。Stability AI曾计划在未来几个月内寻求四倍于此的估值,尽管公司收入较低,烧钱速度较高。
在这一时期,Stability AI还面临一次高管离职。公司副总裁Ed Newton-Rex在一份公开信中表示,他因对如何使用版权数据进行争论而离开了公司。这也是公司面临的另一次挫折,因为Newton-Rex曾在稳定AI音乐生成工具Stable Audio的推出中扮演了关键角色。
官方演示视频: https://www.youtube.com/watch?v=G7mihAy691g
MIT华人博士生将ChatGPT搬进Jupyter,自然语言编程一站式搞定
自然语言编程,在Jupyter里就能直接完成了!这款由MIT华人博士生打造的插件,实现了编程工具与GPT-4的无缝衔接。加载好之后,只要「说」出自己想要的程序,就能得到代码并直接调试运行。结合ChatGPT和Jupyter的名字,作者将其命名为Chapyter。Chapyter发布后,vscode用户投来了羡慕的目光,并期待自己有朝一日也能用上。站长网2023-07-31 18:20:230000阿里巴巴智能信息事业群发布夸克大模型 夸克App将升级为AI助手
据证券时报消息,11月14日,阿里巴巴智能信息事业群发布了全栈自研、千亿级参数的夸克大模型。这个大模型将应用于通用搜索、医疗健康、教育学习、职场办公等场景。夸克App也将借助自研大模型全面升级,加速迈向年轻人工作、学习、生活的AI助手。阿里巴巴智能信息事业群总裁吴嘉表示,基于大模型的AIGC技术将会给搜索产品带来全新变化,加速迈向下一代搜索。站长网2023-11-14 15:02:30000011分钟训完GPT-3!英伟达H100成功创下8项测试纪录 黄老板又赢麻了!
最近,机器学习及人工智能领域开放产业联盟MLCommons公布了两项MLPerf基准测试的最新数据:在人工智能算力表现测试中,英伟达的H100芯片组刷新了所有组别的纪录,也是唯一一个能够执行完所有基准测试的硬件平台。在最新的MLPerf基准测试中,H100成功创下8项测试纪录。外媒还透露,下一代消费级显卡可能会在2025年发布。站长网2023-06-29 15:59:4200002023百度十大科技前沿发明公布 超70%涉及大模型和重构创新
近日,百度公布了“2023百度十大科技前沿发明”,十大前沿发明中,超过70%涉及大模型和重构创新。据悉,发布的十大科技前沿发明涉及大模型、基于大模型的端到端搜索、飞桨、AI芯片、生成式检索、内容生成推荐技术、自动驾驶决策系统、生物计算大模型、高性能量子芯片。百度表示,随着越来越多的大模型产品陆续上线,我国生成式人工智能发展也将从“拼大模型参数”阶段步入“拼原生应用、拼产业落地”阶段。站长网2023-09-14 19:43:090000五倍吞吐量,性能全面包围Transformer:新架构Mamba引爆AI圈
屹立不倒的Transformer迎来了一个强劲竞争者。在别的领域,如果你想形容一个东西非常重要,你可能将其形容为「撑起了某领域的半壁江山」。但在AI大模型领域,Transformer架构不能这么形容,因为它几乎撑起了「整个江山」。站长网2023-12-05 14:15:180001