国产Sora来了!清华发布视频生成大模型“视界一粟YiSu”
站长网2024-06-13 10:53:521阅
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟 YiSu”。
该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。
年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。
而视界一粟YiSu”则是基于团队自研的视频生成大模型技术,并没有止步于DiT。该团队融合LLM和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到优化,打造视频生成的方案。
此前,该团队曾提出WorldDreamer,是全球第一次以Transformer和LLM(Masked Token路线)为中心的视频生成工作。
此次发布的视频生成大模型,是YiSu-Beta V0.5版本,YiSu大模型正在按照每周一个小版本、每月一个大版本的迭代速度成长进化。未来几个月,在视频时长、可控性、推理速度、运行成本、理解物理世界等方面还将持续迎来大幅度的提升。
据了解,极佳科技核心团队拥有超过十年的AI技术积累。其团队来自清华大学、中科院、中科大等知名院校,累积发表AI顶级论文200余篇,多次获得全球权威AI比赛世界冠军。
0001
评论列表
共(0)条相关推荐
AI扩图哪家强?我们实测了最流行的5个扩图工具
AI扩图的命运齿轮开始转动了。近日,“AI扩图”在各个社交平台上频频出圈,#AI扩图#话题,在抖音平台累计播放数超7.8亿次。相关话题#用AI扩图拯救相册废照#、#让人意想不到的AI扩图#,登上抖音热榜前10,累计参与人数分别达16.08万和2.73万。这些话题的火爆,得益于剪映新上线的“智能扩图”功能。有人表示:“受益了,直接拯救废片”。不过,也有网友反馈:“AI扩图,越扩越废”。站长网2023-12-08 14:57:1400030研究表明:GPT-4在图形推理任务上表现不佳,准确率仅33%
要点:美国圣塔菲研究所的研究显示,GPT-4在图形推理任务上的准确率仅为33%,而多模态版本GPT-4v的表现更差,只有25%。通过使用ConceptARC数据集,作者对451名人类受试者进行了图形推理任务测试,结果显示人类的平均正确率为91%,远高于GPT-4。站长网2023-11-21 17:08:510000Arm上市暴涨28%,科技股IPO的春天要回来了?
是吹响复苏号角还是开启新一轮的泡沫。文|Juny编辑|VickyXiao万众期待中,今年迄今为止最重要的一桩IPO正式登陆纳斯达克。昨天,芯片设计商Arm公布IPO的最终发行价格为51美元/股,按发行价计算总市值约为540亿美元。当时,51美元的定价是此前47至51美元招股区间的上限,提前申购数量超过了计划出售股票数量的10倍,已经释放出非常积极的信号。站长网2023-09-15 16:06:450000评论数达10万!Redmi K70京东好评率超98%
小米公司王腾近日在微博上盛赞RedmiK70,称其为2-3K价位中口碑和销售最好的产品之一。据他透露,该机在京东平台上的评论数已达10万,好评率高达98%以上,如此出色的销量和口碑,背后正是其全面领先的产品力。王腾强调,RedmiK70在性能、屏幕和主摄方面都表现出色,堪称同档位无敌。该机还搭载了全新的小米澎湃OS,为用户带来流畅的体验,并可尽享小米全生态智能体验。0000如何一天生产100条变现素材?
不论你是做短视频、微商还是做私域IP销售,大家都逃不过一点,每天都在为发布的素材而发愁。今天到底拍什么短视频?就这一个产品有什么好拍的?今天朋友圈的文案都不知道发什么了明天该给代理发什么营销素材?其实,你只要掌握村长今天给你分享的这一套方法,以后你就不用为生产素材而发愁了。任何一个产品、一个账号、一个项目拿到手,你就知道怎么生产内容了。01故事法0000