南洋理工开源创新性文生视频模型FreeInit
要点:
1、创新性文生视频模型FreeInit通过重新初始化噪声,改进时间的一致性。
2、研究人员发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除。
3、FreeInit通过多次迭代重复采样优化过程,提升低频信息质量,改善生成视频质量。
南洋理工大学S实验室的研究人员开源了一种创新性文生视频模型,名为FreeInit。他们发现视频扩散模型在生成视频时存在时间一致性不足和不自然的动态效果。
开源地址:https://github.com/tianxingwu/freeinit
论文地址:https://arxiv.org/abs/2312.07537v1
为了解决这个问题,他们提出了一种通过重新初始化噪声的方法来改善时间一致性。他们发现视频扩散模型的推理初始化噪声中低频信息很难被完全移除,这可能是导致生成视频效果不佳的原因之一。为了验证FreeInit的有效性,研究人员进行了大量实验,结果显示FreeInit可以显著提高模型的时间一致性指标。
具体来说,FreeInit的采样优化过程包括多个步骤:
推理的第一步,FreeInit先初始化独立高斯噪声,然后通过离散采样策略采样生成初步的视频潜码。
利用扩散模型的去噪功能,从完全随机的噪声中采样出较为清晰的视频潜码。
获取上一步生成视频潜码的带有时间相关性的噪声版本,将生成的视频潜码通过原始的高斯噪声进行正向扩散过程,使其重新含有低频时间相关信息。
将含低频相关性噪声与新的高斯噪声高频部分结合,得到重新初始化的噪声,并为下一轮采样的初始提供输入。
通过多次重复迭代,FreeInit可以进一步累积提升低频信息质量,逐步弥合训练和推理的初始化差距,从而改善生成视频的质量和时间一致性。研究人员表示,FreeInit在多个文到视频生成模型上进行的实验中取得了较好的效果。他们开源了FreeInit的代码和论文,供研究者们参考和使用。
华为:Pura 70标准版不支持星闪 Pro/Pro +/Ultra标配
华为Pura70系列先锋计划已启动,官网现已上架全系列四款新品。然而,近期有部分用户反馈称,他们对Pura70标准版未能支持华为领军的星闪技术表示遗憾。针对此问题,华为终端客服官微在余承东的评论区进行了明确回应:虽然Pura70标准版并不支持星闪技术,但同系列的Pura70Pro、Pura70Pro以及Pura70Ultra均搭载了这一技术。站长网2024-04-19 10:11:570000十八部门:探索利用AI弥补优质教育教学资源不足
据教育部网站消息,近日,教育部等十八部门联合印发《关于加强新时代中小学科学教育工作的意见》,旨在适应科技发展和产业变革需要,从课程教材、实验教学、师资培养、实践活动、条件保障等方面强化顶层设计,充分整合校内外资源,推进学校主阵地与社会大课堂有机衔接,为中小学生提供更加优质的科学教育,全面提高学生科学素质,培育具备科学家潜质、愿意献身科学研究事业的青少年群体。站长网2023-05-29 14:48:200000男子脚踩112张王国之泪游戏卡入境被查获 网友:这游戏“味儿”有点大
相信很多Switch玩家都熟悉任天堂的一个笑话:“卡带是‘甜’的”。有些新手玩家甚至真的会尝试舔一下Switch的卡带。不过,以后大家还是不要再舔Switch卡带了。这是因为卡带不仅是苦的(任天堂为了防止儿童误食,给卡带加了一种叫做苯甲地那铵的物质,它具有苦味但无毒),而且有可能被别人“踩过”。站长网2023-06-29 15:46:000000Anthropic将Claude AI扩展到更多国家,加拿大暂不在列
划重点:1.Anthropic公司将Claude2大型语言模型引入95个国家,但却不包含加拿大。2.加拿大政府对人工智能监管较为严格,可能导致一些AI公司犹豫进入该市场。3.Anthropic公司正努力将Claude2引入加拿大,尽管目前缺乏确切的时间表。站长网2023-10-20 10:21:340000