清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」
在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。
这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。它不仅能一键生成长达16秒、清晰度达到1080P的高清视频,更能在模拟真实物理世界的同时,展现出惊人的想象力。多镜头生成、时空高度一致,这些都是Vidu的独特魅力。

值得一提的是,Vidu自发布以来,便在全球范围内取得了显著突破,其性能与国际顶尖水平比肩,并仍在不断迭代优化中。这一成就,离不开团队在贝叶斯机器学习和多模态大模型领域的深厚积累和多项原创性成果。
特别是团队于2022年9月提出的U-ViT架构,作为全球首个Diffusion与Transformer的融合架构,为Vidu的诞生奠定了坚实基础。随后,在2023年3月,团队再次领先,开源了基于U-ViT融合架构的多模态扩散模型UniDiffuser,成功验证了U-ViT架构的大规模可扩展性。
基于对U-ViT架构的深入理解和丰富的工程、数据经验,团队在极短的时间内攻克了长视频表示与处理的多项关键技术难题,从而研发出了Vidu视频大模型。这款模型在提升视频连贯性和动态性方面表现出色,进一步推动了视频处理技术的发展。
Vidu的问世,不仅再次验证了U-ViT融合架构在大规模视觉任务中的卓越性能,也展示了生数科技在多模态原生大模型领域的持续创新能力和行业领先地位。作为通用视觉模型,Vidu能够生成更加多样化、更长时长的视频内容,其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的边界提供无限可能。
申请地址:
https://shengshu.feishu.cn/share/base/form/shrcnybSDE4Id1JnA5EQ0scv1Ph
小米汽车回应交付周期过长:已开启双班倒 日产能可达600-800台
快科技9月10日消息,小米汽车最近在社交平台上宣布,其超级工厂在实施双班生产模式后,日产能已达到600至800台,若每周按6天计算,周产能在3600至4800台之间。自小米SU7首车上市以来,市场对其产能和交付能力一直高度关注。小米汽车App显示,小米SU7Pro和小米SU7Max的交付周期分别预计为20至23周和21至24周。站长网2024-09-11 21:14:070000品牌出海“助燃剂”?卖家精灵推出AI智能评论分析
产品同质化?产品研发沉迷于自我想象?产品营销没有清晰的方向?爆品可望不可即?以上是不少跨境从业者的痛点。打开亚马逊网站,满眼相似性的产品,连主图都趋于同一场景。这样的市场,很容易走向价格的厮杀,也许销量好看,然而利润微薄甚至亏损。在价格战中,没有人是赢家。站长网2023-05-23 09:45:010001DistilBERT:更小、更快、更便宜的大型语言模型压缩方法
要点:1.近年来,大型语言模型的发展迅猛,BERT成为其中最受欢迎和高效的模型,但其复杂性和可扩展性成为问题。2.为了解决这个问题,采用了知识蒸馏、量化和修剪等压缩算法,其中知识蒸馏是主要的方法,通过让较小的模型模仿较大模型的行为来实现模型压缩。站长网2023-10-08 09:56:450000Meta CEO 扎克伯格希望通过数字助手、智能眼镜和人工智能来帮助推动元宇宙
站长之家(ChinaZ.com)9月28日消息:Meta推出了新的人工智能工具和名人代言的数字助手,CEO马克·扎克伯格希望这些工具可以帮助启动元宇宙。在加利福尼亚州门洛帕克总部举行的MetaConnectVR开发者大会上,扎克伯格展示了AI软件、公司新款Quest3虚拟现实头戴设备以及最新款Ray-Ban智能眼镜。站长网2023-09-28 09:08:030002