清华团队国产“Sora”火了：生数科技发布视频大模型「Vidu」

站长网2024-04-28 20:50:320阅

在中关村论坛的未来人工智能先锋论坛中，生数科技与清华大学携手，正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。

这款引领时代的视频大模型，其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。它不仅能一键生成长达16秒、清晰度达到1080P的高清视频，更能在模拟真实物理世界的同时，展现出惊人的想象力。多镜头生成、时空高度一致，这些都是Vidu的独特魅力。

值得一提的是，Vidu自发布以来，便在全球范围内取得了显著突破，其性能与国际顶尖水平比肩，并仍在不断迭代优化中。这一成就，离不开团队在贝叶斯机器学习和多模态大模型领域的深厚积累和多项原创性成果。

特别是团队于2022年9月提出的U-ViT架构，作为全球首个Diffusion与Transformer的融合架构，为Vidu的诞生奠定了坚实基础。随后，在2023年3月，团队再次领先，开源了基于U-ViT融合架构的多模态扩散模型UniDiffuser，成功验证了U-ViT架构的大规模可扩展性。

基于对U-ViT架构的深入理解和丰富的工程、数据经验，团队在极短的时间内攻克了长视频表示与处理的多项关键技术难题，从而研发出了Vidu视频大模型。这款模型在提升视频连贯性和动态性方面表现出色，进一步推动了视频处理技术的发展。

Vidu的问世，不仅再次验证了U-ViT融合架构在大规模视觉任务中的卓越性能，也展示了生数科技在多模态原生大模型领域的持续创新能力和行业领先地位。作为通用视觉模型，Vidu能够生成更加多样化、更长时长的视频内容，其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的边界提供无限可能。

申请地址：

https://shengshu.feishu.cn/share/base/form/shrcnybSDE4Id1JnA5EQ0scv1Ph

清华团队国产Sora火了 生数科技发布视频大模型Vidu

0000

评论列表

共(0)条

相关推荐

站长资讯
华为Mate X6折叠手机官宣11月26日发布
华为公司今日宣布，其全新的折叠旗舰手机MateX6将于11月26日正式发布。自2019年推出MateX以来，华为在折叠屏技术领域不断追求创新，致力于为用户提供更优质的折叠体验。11月26日，华为Mate70系列和MateX6系列将共同亮相于华为Mate品牌盛典。
站长网2024-11-21 09:32:02
0000
站长资讯
月售5亿、力压东方甄选，仅有85万粉的老郑掌握了什么财富密码？
最近，一位翡翠玉石品类的主播引起了关注。@新疆和田玉老郑以超5亿的直播GMV超越东方甄选，登上抖音电商5月带货主播榜单第一名。而最让人惊奇的是，这位主播的粉丝仅有85万，与@东方甄选3千万的粉丝量级有着较大的差距。@新疆和田玉老郑是如何做出这样的成绩的?珠宝赛道在直播带货领域有什么样的特色?平民路线是吸引用户的关键
站长网2023-06-10 03:09:54
0000
站长资讯
商家注意！抖音封禁“快速过款”玩法
近日，抖音电商发布新规公示《「违规玩法:快速过款」实施细则》，将快速过款直播列为违规行为，根据情节严重程度处以限流、封禁直播间等处罚。
站长网2023-10-30 12:06:18
0000
站长资讯
AI人才供不应求 ChatGPT研究员平均月薪6.7万元
快科技12月16日消息，脉脉发布的《2023年度人才迁徙报告》显示，ChatGPT研究员以平均月薪6.7万元位列高薪榜榜首。AI相关岗位人才供不应求，在高薪岗位TOP20中，以ChatGPT研究员、算法、深度学习为代表的AI岗位拥有10席，占了半壁江山。在2023年，互联网、电商等多个行业对人工智能人才展开争夺，纯互联网行业成为新发人工智能相关岗位最高的行业，占比为23.29%。
站长网2023-12-16 16:08:04
0000
站长资讯
iPhone 16 Pro Max可能将配备超长焦摄像头
据macrumors消息，iPhone16ProMax可能是第一款采用超长焦潜望镜相机的iPhone手机，这种相机可以大幅提高光学变焦倍数，这是来自亚洲的一份新报告透露的。
站长网2023-07-19 11:02:46
0000