Open-Sora 1.1发布 视频质量提升,生成时长延长至21秒
站长网2024-05-28 19:35:421阅
Open-Sora1.1发布,带来了显著的提升,尤其是在视频生成的质量和时长方面。新版本模型能够生成最长约为21秒的视频,使用更高质量的视觉数据和字幕进行训练,从而使其更好地理解世界的运作。此外,优化后的CausalVideoVAE架构提高了性能和推理效率。
主要更新和特点:
视频生成质量和时长提升:新版本在视频生成的质量和时长方面都有显著提升,现在能够生成最长约为21秒的视频。
高质量视觉数据和字幕训练:通过使用更高质量的视觉数据和字幕进行训练,模型对世界运作的理解得到了增强。
CausalVideoVAE架构优化:对CausalVideoVAE架构进行了优化,这不仅提升了视频生成的性能,还提高了推理效率。
与Sora基础模型性能相似:实验结果显示,v1.1.0版本的性能与Sora基础模型相似,这证明了版本演化与Sora所展示的缩放定律的一致性。
新版本的开源释放对社区的视频生成发展具有重要意义。开源的代码、数据和模型为社区提供了方便的后续开发条件。
官方项目页介绍了对CausalVideoVAE的一系列改进,包括模型结构的优化和推理技巧的引入,进一步提升了模型的性能和效率。
Open-Sora-Plan v1.1.0的这些更新和改进,展示了视频生成技术在理解力、性能和效率方面的持续进步,同时也为未来的研究和开发奠定了基础。
项目地址:https://top.aibase.com/tool/open-sora-plan-v1-1-0
在线体验地址:https://huggingface.co/spaces/LanguageBind/Open-Sora-Plan-v1.1.0
0001
评论列表
共(0)条相关推荐
To C大模型,亏钱也得干
大模型的两条落地方向,虽南辕北辙但境遇相似。被寄予商业化落地厚望的是确定性较强的toB方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。而此前尚属于测试阶段的toC方向自不必说,无论是产品形态的成熟度还是用户心智深度都还不足以支撑商业化,这也是业内将聚光灯自最初的C端向B端转移的原因。站长网2023-10-06 09:36:310000英格兰法官获准使用ChatGPT进行法律裁决
#划重点1.法官可使用ChatGPT协助书写法律裁决,尽管有人警告AI可能捏造不存在的案例。2.英格兰和威尔士的数千名法官收到司法办公室的官方指导,认为AI可用于总结大量文本或执行行政任务。3.指导警告ChatGPT等聊天机器人在进行研究时效果差,容易虚构案例或法律文本,并提到深度伪造技术可能用于制造虚假证据。站长网2023-12-12 16:29:370002微信视频号打击低俗色情信息 累计处置14844个低俗色情账号
微信视频号发布《关于低俗色情信息的治理公告》称,有部分用户利用视频号功能,发布低俗色情等违法违规信息,严重污染视频号的健康生态。视频号安全团队持续加强对“低俗色情”类违规内容的巡查与打击力度。经用户投诉和平台日常巡查,发现部分视频号用户存在:发布隐晦表现性行为、具有性挑逗的内容;发布明显色情动作及色情语音的内容;甚至直接发布打码版色情视频片段,或在视频画面上留下个人账号进行不当引流。站长网2023-08-07 08:45:3500004年来最大版本!腾讯手机QQ 9.0 iOS正式版发布:全新界面、启动更快
快科技12月17日消息,今日,腾讯手机QQiOS版迎来9.0大版本升级,距离上次大版本(8.0)更新已经过去4年时间。更新日志显示,手机QQ9.0带来了界面轻盈焕新、在线状态自由定义,同时支持群文件在线预览,支持多群管理等提效能力。实测后发现,相比上一个版本,手机QQ9.0应用启动更快,动画也更流畅(测试机型iPhone13Pro、版本iOS17.2)。0000设计界的“奥斯卡”!苹果Vision Pro获黑铅笔奖
站长之家(ChinaZ.com)5月27日消息:近日,全球非营利组织设计与艺术指导协会(DAD)授予了苹果公司一项极具分量的奖项——黑铅笔奖。此次殊荣是对苹果VisionOS操作系统在数字设计领域卓越成就的认可。站长网2024-05-27 14:56:150000