南洋理工发布提高AI视频生成内容一致性方法FreeInit
要点:
FreeInit方法提升视频扩散模型生成的时空一致性。
通过发现噪声初始化在视频扩散模型中存在的隐含训练-推理差距,提出了FreeInit,无需额外训练,不引入可学习参数。
FreeInit通过迭代优化推理初始噪声的时空低频组件,弥补训练和推理之间的初始化差距,显著提高生成结果的时空一致性。
南洋理工大学发布了一项名为FreeInit的方法,该方法可以大幅提高人工智能视频生成的内容一致性。演示显示这一方法非常流畅,并且可以与现有的SD生态结合。此外,他们还发表了与Animatediff结合的方法,只需等待一些专业人士制作插件,就可以使用这一方法。视频中展示了使用了FreeInit和未使用FreeInit的Animaetdiff的对比。
项目地址:https://tianxingwu.github.io/pages/FreeInit/
根据他们的介绍,他们深入研究了视频扩散模型的噪声初始化,并发现了一个隐含的训练-推断差距,导致了推断质量的下降。他们的关键发现包括推断时初始潜变量的信噪比(SNR)的时空频率分布与训练时本质上不同,以及去噪过程受到初始噪声的低频分量的显著影响。
在受到这些观察的启发下,他们提出了一种简洁而有效的推断采样策略FreeInit,该策略能够显著改善扩散模型生成的视频的时间一致性。通过在推断过程中迭代地优化初始潜变量的时空低频分量,FreeInit能够弥补训练和推断之间的初始化差距,从而有效改善生成结果的主体外观和时间一致性。
FreeInit以迭代方式改进推断初始噪声,通过DDIM采样、DDPM前向和噪声重新初始化,初始噪声的低频成分逐渐得到改进,从而持续增强时间一致性和主体外观。
这一方法的发布为人工智能视频生成领域带来了新的突破,将有望提高视频生成的质量和时间一致性。随着这一技术的不断发展和完善,相信将会为视频内容创作和人工智能应用带来更多的可能性。
微软考虑在 Sam Altman 回归 OpenAI 后加入其董事会
据TheInformation消息,了解谈判情况的两名消息人士透露,作为OpenAI最大的支持者,微软正在考虑在被解雇的CEOSamAltman返回这家ChatGPT开发商后,担任其董事会的一员的角色。报告补充说,微软可以选择成为OpenAI董事会的一员,或作为没有投票权的观察员。站长网2023-11-20 10:46:560000苹果A17 Pro跑分对比:遥遥领先骁龙8 Gen 2 单核硬刚Intel
随着苹果iPhone15Pro系列的问世,手机性能再上一个层面,其搭载的苹果A17Pro性能可谓秒杀一切安卓、鸿蒙机型。现在数码博主肥威”汇总了几个主流的跨平台处理器的GeekBench分数对比,包括苹果上一代A16、骁龙8Gen2领先版(超频版)、酷睿i9-13900K、AMD锐龙97950X,甚至把M2Ultra和最新的14900KF都加进去了。站长网2023-09-17 09:16:280001英国数据保护监管机构结束对Snap GenAI聊天机器人的隐私调查
站长之家(ChinaZ.com)5月22日消息:英国数据保护监管机构结束了对Snap人工智能聊天机器人MyAI的调查,并表示对公司解决儿童隐私风险问题感到满意。ICO向业界发出一般性警告,要求评估人工智能产品推向市场前的风险。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-05-22 15:47:030000苹果M5芯片或2025年底发布:同步全新iPad Pro推出
苹果公司计划在本周推出搭载M4芯片的全新Mac系列产品,包括MacBookPro、iMac和Macmini等。同时,知名分析师MarkGurman在最新的专栏中透露,苹果可能会在2025年底发布M5芯片,并有望在同一时间推出新的iPadPro系列。0000被骗了?GPT-4 其实没有推理能力?!
今年三月,OpenAI重磅发布了GPT-4大模型,带来了比ChatGPT背后GPT-3.5更强的推理、计算、逻辑能力,也引发了全民使用的热潮。在各行各领域研究人员、开发者、设计师的使用过程中,「GPT-4是最为领先的大模型」似乎已成为了公认的结果。站长网2023-08-10 17:08:280000