清华团队国产“Sora”火了:生数科技发布视频大模型「Vidu」
在中关村论坛的未来人工智能先锋论坛中,生数科技与清华大学携手,正式推出了中国首个具备长时长、高一致性及高动态性的视频大模型——“Vidu”。
这款引领时代的视频大模型,其核心在于团队原创的Diffusion与Transformer融合的U-ViT架构。它不仅能一键生成长达16秒、清晰度达到1080P的高清视频,更能在模拟真实物理世界的同时,展现出惊人的想象力。多镜头生成、时空高度一致,这些都是Vidu的独特魅力。
值得一提的是,Vidu自发布以来,便在全球范围内取得了显著突破,其性能与国际顶尖水平比肩,并仍在不断迭代优化中。这一成就,离不开团队在贝叶斯机器学习和多模态大模型领域的深厚积累和多项原创性成果。
特别是团队于2022年9月提出的U-ViT架构,作为全球首个Diffusion与Transformer的融合架构,为Vidu的诞生奠定了坚实基础。随后,在2023年3月,团队再次领先,开源了基于U-ViT融合架构的多模态扩散模型UniDiffuser,成功验证了U-ViT架构的大规模可扩展性。
基于对U-ViT架构的深入理解和丰富的工程、数据经验,团队在极短的时间内攻克了长视频表示与处理的多项关键技术难题,从而研发出了Vidu视频大模型。这款模型在提升视频连贯性和动态性方面表现出色,进一步推动了视频处理技术的发展。
Vidu的问世,不仅再次验证了U-ViT融合架构在大规模视觉任务中的卓越性能,也展示了生数科技在多模态原生大模型领域的持续创新能力和行业领先地位。作为通用视觉模型,Vidu能够生成更加多样化、更长时长的视频内容,其灵活的架构也将为未来兼容更广泛的模态、拓展多模态通用能力的边界提供无限可能。
申请地址:
https://shengshu.feishu.cn/share/base/form/shrcnybSDE4Id1JnA5EQ0scv1Ph
拥有500万用户的独角兽初创公司Character.AI正面临版权问题
Character.AI是一家价值10亿美元的聊天机器人初创公司,由谷歌前工程师创立。该公司正面临着对抗色情内容、侵权和版权问题以及用户生成内容的管理挑战。具体来说,Character.AI由NoamShazeer和DanielDeFreitas于2021年11月创立,两位创始人都是谷歌的前工程师。平台上托管了惊人的1600万个聊天机器人,每月访问量超过2亿次,拥有约500万用户。站长网2023-07-12 11:35:360001快手自研文生图大模型可图Kolors开启内测
据未来科技力消息,快手自研的文生图大模型“可图”(Kolors)已于近期开启内测。该大模型具有强大的文本理解、丰富的细节刻画和多样的风格转化特点。此前,快手在APP评论区已开始内测“AI玩评”功能,内测中的“AI玩评”功能可以根据用户输入的文字生成相应的图像,并提供多种风格选择。站长网2023-09-18 17:31:33000000后在拼多多卖花茶:将平替卖成爆款,年销上千万
做电商的两年时间里,王子豪至今对那一次爆单记忆犹新。他的店铺里,每袋只卖一毛钱的茉莉花袋泡茶,上线不久便火了,两个月内就卖了100万元。这是一名00后商家的创业故事。2022年起,王子豪开始在拼多多开设网店创业,多款花草茶成为平台爆品,去年仅10款爆品销售额就达到1000万元左右,团队经常打包忙到凌晨一两点,早上六七点起床继续干。站长网2024-07-10 10:48:480000韩国漂流记:明星在面前,咖啡在手里,中国互联网公司在广告墙
5月13日,一个普通的周六,一架从中国北京起飞的飞机在韩国首尔金浦机场落地,爱捞一走出机场,就看到有站姐在不远处举起相机,对着下行电梯拍摄一位小爱豆。这位男爱豆穿着暗色的衣服,戴着帽子和口罩,全身上下包裹得密不透风,看不出是谁。同一时间,在机场外,还有一群站姐背着“大炮”,送ZB1去往日本参加活动。这个男团在不久前刚刚成立,以C位出道的章昊来自乐华娱乐,并成为选秀史上第一位在韩国出道的中国人。站长网2023-05-21 10:16:370002Surfshark 安全报告显示 AI 事故飙升:特斯拉、Facebook、OpenAI 占据前三
据安全公司Surfshark表示,第一个「AI事故」差点引发了全球核战争。最近出现的AI事故、错误、欺诈和诈骗包括利用深度伪造技术影响政治、聊天机器人提供错误的健康信息,以及危及行人安全的自动驾驶汽车。根据Surfshark的报告,最糟糕的违规者是特斯拉、Facebook和OpenAI,它们占所有已知AI事故的24.5%。站长网2023-06-30 01:35:060000