“快手版Sora”可灵开放测试 最长可生成2分钟视频
快手公司推出了一款名为可灵的全新国产视频生成大模型,它采用了与Sora相似的技术路线,并结合了快手自研的技术创新。这款模型能够生成长达2分钟、30fps、1080p分辨率的超长视频,并支持多种宽高比。不同于实验室的Demo或视频演示,「可灵」是快手推出的产品级应用,并已在快影APP中正式开启邀测。
可灵大模型能够在想象中天马行空,同时在描绘运动时符合真实的运动规律,准确刻画复杂、大幅度的时空运动。它不仅能模拟真实物理世界的特性,生成符合物理规律的视频,还能处理与真实物理世界的交互,例如在视频中展现小男孩吃汉堡时齿印的变化。
可灵采用了原生的文生视频技术路线,替代了图像生成加时序模块的组合,这是它能够生成视频时间长、帧率高,并准确处理复杂运动的关键。快手大模型团队着重考虑了模型设计、数据保障、计算效率以及模型能力的扩展这四大核心要素。
在模型设计方面,可灵采用了类Sora的DiT结构,用Transformer代替了传统扩散模型中基于卷积网络的U-Net,并通过自研的3D VAE网络和全注意力机制(3D Attention)提升模型的建模能力。
数据构建方面,快手大模型团队构建了完备的标签体系,精细化筛选训练数据,并研发了视频描述模型,以生成精确、详尽、结构化的视频描述。
运算效率方面,「可灵」使用了传输路径更短的flow模型作为扩散模型基座,并采用分布式训练集群和算子优化等手段提升硬件利用率。
模型能力扩展方面,「可灵」支持自由的长宽比,并研发了基于自回归的视频时序拓展方案,同时还支持多种控制信息输入。
可灵大模型的应用不仅限于视频生成,快手还基于此模型推出了其他应用,如"AI舞王"和"AI唱跳",并即将推出图生视频功能。
快手在大模型技术方面动作迅速,已与多个高校或科研机构合作发布了多项关键技术,为可灵大模型积累了深厚的技术沉淀。现在,快手的文生视频功能已正式亮相,期待其在短视频场景中的应用落地。
对AI视频创作感兴趣的用户,可以在快影APP中体验可灵大模型的功能。
官网地址:https://kling.kuaishou.com/
“我在得物做电商,仅靠3个运营年入1亿,退货率不到10%”
01三个运营年卖货1个亿他们在得物偷偷赚钱4年前,还在读大三的奚家庆在得物赚到第一桶金。当时奚家庆嗅到潮流运动鞋的商机。于是,他鼓起勇气用兼职攒下的2万元采购鞋子,在得物出售。短短几天就售罄一空,奚家庆小赚一笔。在此之前,他几乎没有任何电商经验。尝到甜头的他快速起盘,连续完成了多笔订单,有时候一单就能赚几百元。站长网2024-04-26 14:23:250000消息称iPhone15数据线升级 1.5米长编织材质USB-C双接口
最近,有消息称苹果公司计划为其即将发布的iPhone15系列手机配备一款全新设计的USB-C数据线。据悉,这款数据线采用编织技术和双接口设计,长度达到1.5米,比现有的Lightning数据线长出50%。数据线的颜色也将与手机机身颜色相匹配,为用户提供更多选择。站长网2023-08-23 16:26:540000苹果WWDC24将于6月11日举行 iOS 18多项AI技术将发布
苹果官方公众号揭晓了WWDC24(苹果全球开发者大会)的邀请函,正式宣告这一科技盛事将于北京时间6月11日凌晨1点拉开帷幕。大会上,苹果将重磅发布新一代操作系统家族,包括iOS18、iPadOS18、macOS15、tvOS18以及watchOS11和visionOS2。其中,iOS18无疑是消费者最为关注的焦点。站长网2024-06-04 10:50:550000AI视野:百度推视频生成模型UniVG;下一代大模型Llama3正在训练;腾讯推视频模型VideoCrafter2;TikTok测试AI作曲功能
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用1、百度推出视频生成模型UniVG可处理各种文本和图像的组合输入【AiBase提要:】⭐UniVG是一种“统一模态视频生成系统”。站长网2024-01-19 15:52:490000Apple GPT明年上iPhone,苹果被爆秘密研发Ajax框架,Siri大升级,市值几秒暴增千亿
站长网2023-07-21 17:06:370000