解读1秒生成高精准图片模型——SDXL Turbo

站长网2023-12-23 09:41:140阅

前不久，著名开源生成式AI平台Stability.ai发布了，全新文生图模型SDXL Turbo。该模型只需1秒甚至更少的时间就能生成高精准图片，可将通常50个生成步降至1—4步。

Stability.ai表示，SDXL Turbo能有如此快的推理效率是使用了全新的技术——对抗式扩散蒸馏（Adversarial Diffusion Distillation，简称ADD）。

简单来说，ADD就是在“疯狂内卷严师指导”的双重模式下，用最短的时间、最高效的学习方法考上了清、北。

现在你读上面那段话可能有点迷糊，看完全文后你就会心疼ADD，像极了当年学习的自己。

论文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf

开源地址:https://github.com/Stability-AI/generative-models

什么是大模型蒸馏

为了更好地理解ADD技术原理，「AIGC开放社区」先用通俗易懂的方式为大家介绍一下大模型中的“蒸馏”到底是什么技术。

模型蒸馏是一种将大型复杂模型（通常称为“教师模型”）的知识传输到小型简化模型(即“学生模型”)的技术。

蒸馏过程就像把水果压榨成精华果汁一样，我们尝试保留大模型中最重要的信息，并且让小模型能够捕获并模仿这些内容。

或者可以理解成老师教学生的过程，全部知识不一定都学会，但重要知识点肯定都掌握了。

而ADD能以最快的推理效率生成高质量图片，便使用了对抗损失和分数蒸馏两项重要技术。

一个负责生成图片的质量，另外一个充当“老师”负责教会小模型捕捉重要知识点并进行指导修正。

对抗损失

对抗损失是ADD框架中的一大关键功能。引入了对抗学习的思想，让学生模型与判别器之间进行激烈对抗。

对抗学习源于GAN模型，其核心思路是通过竞争促进模型快速逼近复杂分布。学生模型想方设法生成高质量图像蒙骗判别器，而判别器则全力识破这些虚假的图片。

所以，两人就不得不拼命的内卷，最后生成的图片质量越来越高。此外，对抗过程还可引入条件信息，如文本或图像的特征向量，以增强对应性。

对抗损失中的判别器包含两部分:一个特征提取器和几个判别头。特征网络可以预先在图像分类等任务上训练，然后切掉分类层拿特征向量。这样可以重复使用以前学到的知识。

判别头则在特征的基础上判断图像真伪。训练目标就是最大化真实图的分数，最小化假图的分数。

分数蒸馏

分数蒸馏的核心思想是，让老师模型教学生模型传授重要知识帮助ADD捕获模型的知识点。就是咱们前面介绍的“模型蒸馏”概念。

ADD的老师模型使用了Stability.ai自研性能强大的Stable Diffusion XL和Stable Diffusion2.1两个扩散模型，来监督学生模型ADD-M和ADD-XL生成的图片结果。

具体流程是，先将学生模型生成的图片进一步加噪声，模拟扩散过程，然后让老师模型基于噪声图像输出它的还原结果。

这个还原结果可以作为学习目标，并成为学生模型的生成目标，使自己的图片可以匹配老师模型。同时在老师的指点下，逐步修正偏差达到最佳效果。

在训练过程中，学生模型需要同时面对判别器的对抗，和老师模型的严厉监督，在二者的双重驱动下不断进步。

所以，在最终输出阶段学生模型能用极少的采样步骤1—4，就能输出高质量精准图片。

哎~~万万没想到现实中的高压学习、生活方法也适用于大模型界，看来开发灵感真的无处不在啊，真是名师出高徒，严父出孝子。

解读1秒生成高精准图片模型SDXLTurbo

0000

评论列表

共(0)条

相关推荐

小米SU7供不应求雷军：今天订小米汽车依然要排队六七个月
快科技2月14日消息，小米集团创始人、董事长兼CEO雷军，今日在2025北京海淀区经济社会高质量发展大会上发表了讲演。雷军在演讲时透露，小米利用9个月时间交付了超过13.5万辆车。如果今天订车，依然要排大概六七个月的时间。从小米汽车APP可知，小米SU7和小米SU7Pro目前锁单后预计29-32周交付，也就是要等7-8个月。
站长网站长资讯2025-02-15 10:30:49
0000
站长资讯
APISR：超强动漫图片高清放大器动漫爱好者的福音！
APISR是一款强大的工具，专门设计用于提升动漫图像和视频的分辨率。它不仅可以处理各种图像退化问题，如模糊、噪声、压缩伪影等，还提供了灵活的放大选项，支持2倍、4倍等不同的放大系数。试玩地址:https://top.aibase.com/tool/apisr项目地址:https://github.com/Kiteretsu77/APISR
站长网2024-03-20 15:23:12
0004
站长资讯
超大福利!Runway启动创意合作伙伴计划：为精选用户提供百万积分奖励
文章概要:1.创意合作伙伴计划为选定用户提供无限计划和100万积分。2.计划还提供新功能和AI模型的优先访问权限。3.此举类似YouTube的创作者伙伴计划，有助培育生态系统。AI初创公司Runway最近启动了创意合作伙伴计划，向选定的一组用户提供访问新功能和AI模型的优先权限、免费的无限计划和100万积分。这一计划为Runway的选定用户提供了巨大的福利。
站长网2023-08-30 09:50:07
0000
站长资讯
Windows 12继续免费升级！不会搞云订阅
按照目前的迹象，微软下一代操作系统，也就是传闻中的Windows12，大力集成AI、云功能。近日有传闻称，Windows12可能会改为云订阅收费，按照月度、年度之类的付费，一如很多云服务，一如Windows365。
站长网2023-10-18 21:20:15
0000
站长资讯
令投资人集体出动的「AI陪伴」是伪需求吗？| 对话投资人
翰林会是由一群志同道合的出海投资人发起成立的投资人社群，大家会不定期碰头，讨论一些时下热点话题、交流一些行业观察。本文内容来源于翰林会投资人第一期碰头会的交流讨论，由跨境出海行业头部媒体白鲸出海独家记录、报道。
站长网2024-05-14 18:12:10
0000