南洋理工开源创新性文生视频模型FreeInit
要点:
1、创新性文生视频模型FreeInit通过重新初始化噪声,改进时间的一致性。
2、研究人员发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除。
3、FreeInit通过多次迭代重复采样优化过程,提升低频信息质量,改善生成视频质量。
南洋理工大学S实验室的研究人员开源了一种创新性文生视频模型,名为FreeInit。他们发现视频扩散模型在生成视频时存在时间一致性不足和不自然的动态效果。
开源地址:https://github.com/tianxingwu/freeinit
论文地址:https://arxiv.org/abs/2312.07537v1
为了解决这个问题,他们提出了一种通过重新初始化噪声的方法来改善时间一致性。他们发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除,这可能是导致生成视频效果不佳的原因之一。为了验证FreeInit的有效性,研究人员进行了大量实验,结果显示FreeInit可以显著提高模型的时间一致性指标。
具体来说,FreeInit的采样优化过程包括多个步骤:
推理的第一步,FreeInit先初始化独立高斯噪声,然后通过离散采样策略采样生成初步的视频潜码。
利用扩散模型的去噪功能,从完全随机的噪声中采样出较为清晰的视频潜码。
获取上一步生成视频潜码的带有时间相关性的噪声版本,将生成的视频潜码通过原始的高斯噪声进行正向扩散过程,使其重新含有低频时间相关信息。
将含低频相关性噪声与新的高斯噪声高频部分结合,得到重新初始化的噪声,并为下一轮采样的初始提供输入。
通过多次重复迭代,FreeInit可以进一步累积提升低频信息质量,逐步弥合训练和推理的初始化差距,从而改善生成视频的质量和时间一致性。研究人员表示,FreeInit在多个文到视频生成模型上进行的实验中取得了较好的效果。他们开源了FreeInit的代码和论文,供研究者们参考和使用。
极氪汽车在纽交所上市 创下新能源车企最快上市纪录
站长之家(ChinaZ.com)5月11日消息:极氪汽车昨晚正式在纽约证券交易所挂牌交易,股票代码为“ZK”,这标志着它成为继蔚来、理想和小鹏之后,第四家踏入美国资本市场的中国新能源汽车制造商。值得一提的是,从品牌发布到实现首次公开募股(IPO),极氪仅用了37个月,创下了新能源车企的最快上市纪录。站长网2024-05-11 11:35:230000雷军回应小米汽车定价 称小米汽车会有点贵
小米汽车技术发布会将于12月28日下午2点举行,小米CEO雷军在今日对网友最关心的一些问题进行了解答。雷军表示,小米SU7正在试产爬坡阶段,正式上市还需要几个月时间,关于定价,还没有最终决定。不过,他强调,小米SU7的定价虽然有些高,但这是有理由的。他保证,在体验上,SU7一定会超过大家的预期。0000iQOO 11S发布:充电最快的骁龙8 Gen2旗舰 3799元起
快科技7月4日消息,iQOO11S正式发布。售价方面,iQOO11S12GB256GB售价3799元;16GB256GB售价4099元;15GB512GB售价4399元;16GB1TB售价4799元。对比iQOO11,iQOO11S升级为200W有线闪充,是迄今为止充电速度最快的骁龙8Gen2旗舰手机。站长网2023-07-05 09:17:200001雷军称小米汽车SU7Ultra量产版明年上市 提供两个版本选择
在昨晚的年度演讲返场直播中,雷军宣布小米SU7Ultra的量产版计划于明年上半年上市。虽然价格会相对较高,但雷军保证不会过高。量产车型将保留原型车的底盘结构、电机和电池包配置,即V8sV8sV6s三电机系统,提供高达1548匹马力的动力输出,并配备麒麟二代电池。站长网2024-07-25 10:31:020001向日葵远程崩了上热搜 官方回应:已在紧急修复中
就在刚刚“向日葵远程”登上热搜。有网友反馈称,远程控制软件“向日葵”出现了宕机的情况,页面显示“登录连接异常”。对此,向日葵官方回应称,由于机房线路故障,导致向日葵部分用户无法正常使用,已在紧急修复中,请耐心等待,保持客户端尝试登录状态,恢复后自动登录。站长网2023-09-18 10:53:160000