Open-Sora悄悄升级 支持16秒视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在,该项目不仅支持长达16秒的单镜头视频生成,而且视频分辨率最高可达720p,能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。
技术报告与模型架构:
Open-Sora技术报告已在GitHub上发布,详细介绍了新功能和模型架构。
作者团队对STDiT架构进行了关键性改进,提高了模型的训练稳定性和整体性能。
引入了旋转位置编码(RoPE embedding)和QK归一化技术,以增强训练稳定性。
ST-DiT-2架构能够自动缩放位置编码,处理不同大小尺寸的输入。
多阶段训练方法:
Open-Sora采用了多阶段训练方法,通过分步骤引入数据,高效实现高质量视频生成。
初始阶段视频采用144p分辨率,混训图片和更高分辨率视频。
第二阶段提升至240p和480p分辨率,第三阶段进一步增强至480p和720p。
统一的图生视频/视频生视频框架:
基于Transformer,DiT架构可支持图像到图像及视频到视频任务。
提出掩码策略来支持图像和视频的条件化处理。
掩码策略配置:
引入了随机掩码策略,以随机方式选择并取消掩码的帧,提高模型处理图像条件化的能力。
支持多时间/分辨率/长宽比/帧率训练:
通过分桶策略,使用原始视频的分辨率、长宽比和长度进行训练,增加采样灵活性。
数据收集和预处理流程:
作者团队提供了详尽的数据收集与处理指南,分享了自动化的数据处理流程。
性能全方位评测:
Open-Sora能够将文字描述转化为动人的动态视频,支持多种内容、分辨率、长宽比和时长的生成。
尽管取得了进展,但当前生成的视频在噪声问题、时间一致性、人物生成质量以及美学评分方面仍有待改进。作者团队将在下一版本中优先解决这些挑战。
项目地址:https://top.aibase.com/tool/open-sora
体验地址:https://huggingface.co/spaces/hpcai-tech/open-sora
两辆无人驾驶出租车窄路互不相让 网友:看谁先没电
快科技6月27日消息,据麻辣车评消息,近日,两辆无人自动驾驶汽车在窄路中互不让路的视频,引起网友热议。视频中,两辆车均为百度旗下萝卜快跑自动驾驶测试车辆,在一窄路中两辆车对向行驶到了一块。不过,两辆车均没有避让,都停在了道路中央,互相僵持不动,其中一辆后面还跟着其它社会车辆,在不断鸣笛催促。0000华为周斌:AI算力需求正快速增加
据中证网报道,华为昇腾计算业务CTO周斌在中关村论坛活动期间接受采访时表示,人工智能大模型浪潮带来算力需求的快速增加,并且这个需求是有价值的,不是泡沫。周斌解释道,“AI算力行业出现一个新定律,叫做AI算力增长曲线,这个定律告诉我们大概每隔4个月,AI计算需求就会翻倍。这比‘摩尔定律’更有效地体现在算力需求上。”站长网2023-05-26 15:33:430000东方甄选将于10月17日上线付费会员制度 定价199元/年
据澎湃新闻报道,东方甄选将于10月17日正式上线付费会员制度。东方甄选付费会员定价为199元/年。东方甄选为付费会员提供的专属权益,包括百款自营品88折、一年12张会员券、66元券包入会礼等。东方甄选是新东方的子公司新东方在线推出的直播带货平台。2022年12月28日,东方甄选账号从1个增加到6个,粉丝总量突破3600万。站长网2023-10-16 10:53:070001只需5分钟,教你自测小红书笔记是否限流
大促节点了,整个小红书平台的笔记增速非常快,品牌营销预算投入的也非常大,对小红书的自然流量的挤占是比较明显的,所以最近这段时间小红书的流量竞争也自然非常大,很多博主反应自己的笔记流量比以前少了很多,但也有的博主怀疑,不是因为竞争原因,而是因为平台给自己限流了,但却又没有什么证据。那么该怎么判断笔记是真的被限流了还是笔记内容质量问题呢?站长网2023-10-30 21:13:190000千万粉丝网红账号“一个人的莎士比亚” 遭多平台封禁
拥有超过千万粉丝的短视频网红账号“一个人的莎士比亚”在多个平台被封禁。快手平台显示该账号已被封禁,暂时无法操作;微信视频号显示此账号已被禁止关注,仅在抖音上仍可以正常关注。而引发封禁的原因,可追溯至7月3日,观察者网发布评论指出,该网红拥有超过一千万粉丝,其影响力不亚于官方机构账号。指控其利用民族情绪吸粉、炒作话题。如果仅追求互联网流量、片面放大情绪而非理性稳定,可能会导致流量反噬。站长网2024-07-08 10:28:590000