新图像合成模型LCM SD生成图片推导步骤减少至4步!
要点:
研究人员提出了一种新的图像合成模型,称为潜在一致性模型(LCM),可以在少步推理的情况下生成高分辨率的图像。
LCM是从预训练的潜在扩散模型(LDM)中有效地提取出来的,可以直接预测潜在空间中的概率流ODE的解,避免了多次迭代的需要。
LCM还引入了一种新的微调方法,称为潜在一致性微调(LCF),可以在定制的图像数据集上进行快速的少步推理,实现了文本到图像的生成。
图像合成是计算机视觉领域的一个重要研究方向,目标是根据给定的条件生成逼真的图像。近年来,潜在扩散模型(LDM)在这方面取得了显著的成果,能够生成高分辨率和高质量的图像。然而,LDM的一个主要缺点是它们需要进行多次迭代的采样过程,导致生成速度缓慢。
为了解决这个问题,本文受一致性模型的启发,提出了一种新的图像合成模型,称为潜在一致性模型(LCM)。LCM可以利用任何预训练的LDM,包括稳定扩散模型(SD),并通过少步推理生成高分辨率的图像。LCM的核心思想是将引导反向扩散过程视为求解一个增广概率流ODE(PF-ODE),并设计一个网络来直接预测该ODE在潜在空间中的解,从而减少迭代次数和计算量。
LCM可以从预训练的无分类器引导扩散模型中有效地提取出来,在只需要32个A100GPU小时的训练时间内,就可以生成768×768分辨率的高质量图像。以往我们用 SD 生成图片起码需要20步的推导步骤,但是使用 LCM 只需要4步就行,从一些测试结果看6-8步可能是一个理想的步骤。
项目地址:https://latent-consistency-models.github.io/
这个技术可以让4090在1秒钟生成10张512X512大小的图片.如果可以用在 Animetadiff 中的话可以大幅提高视频生成效率。
此外,论文还介绍了一种新的微调方法,称为潜在一致性微调(LCF),它专门用于在定制的图像数据集上微调预训练的LCM。LCF不需要教师扩散模型,只需要少量数据和训练步骤,就可以使LCM产生具有定制风格的图像。
论文在LAION-5B-Aesthetics数据集上对LCM进行了评估,结果表明LCM在文本到图像生成任务上达到了最先进的性能,并且具有快速、高保真、低失真和低噪声等优点。
论文还展示了LCM使用LCF在Pokemon和Simpsons两个定制数据集上生成图像的效果,证明了LCM具有良好的泛化能力和适应能力。
本文为图像合成领域提供了一种新颖且有效的方法,不仅提高了生成速度和质量,还降低了训练成本和数据需求。本文也为进一步探索潜在空间中的一致性和结构提供了一个有益的尝试。
抖音电商的蓝海秘密
抖音电商再次让人兴奋。5月16日,抖音电商第三届生态大会在广州举办。过去一年,抖音电商已经成为超过700个头部品牌最大的生意阵地,超过18万家成长中的新商家年收入突破百万。未来一年,货架电商会成为重要的机会,对于具备供应链能力的商家而言,迫不及待地摩拳擦掌了。抖音电商也首次向外界推出更加完备的商业模型:全域飞轮模型。在产品流量机制、经营方法论、营销玩法上,都进一步突破,具备的引领性更强了。站长网2023-05-17 09:07:260000苹果Mac游戏模式来了,游戏PC厂商毫不CARE?
能打游戏,但一定打不好。在本月初举行的WWDC2023大会上,苹果公司正式发布了macOSSonoma,其中最大的变化,是「游戏模式」的到来。你没有听错,macOS也拥有了「游戏模式」。简单来说,macOSSonoma提供的「游戏模式」,可以在mac设备进行游戏时,更积极地调动CPU、GPU资源,使用户的体验更加完善。站长网2023-06-17 23:47:330000二次元最大骗局:为爱付费
二次元在今年的溃败,至今还没看到头。在前几年,提起二次元,就一定会说到「为爱付费」。这四个字吸引了大量厂商和团队入局,在当时人们的理解中,只要为用户提供好的内容,其他方面都是次要的。但现在,只要你点开任何一款新产品的评论区,看到用户们讨论最多的,不是角色的数值,就是抽卡的定价。即使这些产品们用上了比以前更好的美术、更好的技术,也开始尝试提升叙事的水准,但玩家似乎也已经不太在乎了。站长网2023-10-26 12:11:160000Ouroboros3D:通过3D感知实现图像到3D的生成
划重点:🔍Ouroboros3D是一个集成了多视角图像生成和3D重建的统一3D生成框架🔍通过递归扩散过程,Ouroboros3D实现了从图像到3D的生成🔍Ouroboros3D采用了基于扩散的多视角图像生成和3D重建方法站长网2024-06-06 17:20:590000AI正在给阿里打开新的产业可能性
AGI依然是一个没有找到确切实现路径的理想,而生成式AI却已经融入进阿里的具体业务中,同时带来的更灵活的场景适配度,也让阿里融入产业有了新可能。2023年9月,阿里将「AI驱动」确定为战略重心之一。过去的一年,阿里围绕AI,在基础能力建设、业务场景改造、新需求开发等多个维度上进行了积极探索。0000