SD3-Turbo:基于LADD的快速文本到图像生成模型
站长网2024-03-19 17:53:360阅
SD3模型还未发布,SD3-Turbo又来了!近日,一篇关于SD3-Turbo的论文引起了广泛关注。该论文主要介绍了Stability AI升级过的蒸馏技术LADD,以及其在SD3-Turbo模型上的应用效果。
LADD(Latent Diffusion Model Distillation)是对原有ADD(Activation Distillation Distillation)技术的改进。原有的ADD技术基于像素级别进行操作,而LADD则利用了预训练的潜在扩散模型中的生成特性。这种策略不仅简化了训练流程,还显著提高了性能。

论文地址:https://arxiv.org/html/2403.12015v1
具体来说,LADD能够有效克服了ADD的限制,使得我们能够生成高分辨率、多宽高比的图像。这一特性在图像生成领域具有重要意义,因为它能够提高生成图像的质量,同时保持较高的效率。
将LADD应用于“稳定扩散3(8B版)”,开发出了SD3-Turbo这一快速模型。令人惊喜的是,SD3-Turbo仅需四步无指导采样,就能达到与当今最先进的文本到图像生成器相媲美的性能。这意味着,SD3-Turbo能够在较短的时间内,生成高质量的图像,大大提高了生产效率。
SD3-Turbo是一个基于LADD的快速文本到图像生成模型,它通过利用预训练的潜在扩散模型中的生成特性,简化了训练流程,提高了性能。这一模型的发布,无疑将为图像生成领域带来新的突破。
0000
评论列表
共(0)条相关推荐
苹果芯跑大模型不用降计算精度,投机采样杀疯了,GPT-4也在用
专攻代码的CodeLlama一出,大家伙都盼着谁来后续量化瘦身一下,好在本地也能运行。果然是llama.cpp作者GeorgiGerganov出手了,但他这回不按套路出牌:不量化,就用FP16精度也让34B的CodeLLama跑在苹果电脑上,推理速度超过每秒20个token。原本需要4个高端GPU才能搞定的活现在用只有800GB/s带宽的M2Ultra就够了,代码写起来嗖嗖快。站长网2023-09-03 08:52:440000苹果 App Store 摘要功能:自动生成、更新和报告不准确的摘要
苹果计划为AppStore引入用户评论摘要功能,旨在帮助用户更容易识别应用程序是否未能兑现其在AppStore中的承诺。该功能将使用AppStore上的所有用户评论来创建一份摘要,重点介绍每款应用的“最常见的客户反馈”。0000SK 海力士发布全球首款 321 层 NAND 样品 助力生成式人工智能发展
站长之家(ChinaZ.com)8月9日消息:SK海力士今天发布了行业中层数最高的NAND技术,采用321层设计,可达到1TbTLC封装。图片来自skhynix该公司在8月8日至10日于圣克拉拉举办的FlashMemorySummit(FMS)2023上介绍了其321层1TbTLC4DNANDFlash的开发进展。站长网2023-08-09 16:46:510000AI潜在风险:AI聊天机器人或成恐怖主义利器
英国的一家恐怖主义监管机构警告说,人类社会可能很快就会开始见证全面爆发的AI辅助的,甚至AI传播的恐怖主义。自2019年以来一直担任英国议会现任独立审查员或恐怖主义立法的乔纳森·霍尔告诉《每日邮报》说道:“我认为完全可以想象,人工智能聊天机器人将被编程,更糟糕的是,传播暴力极端主义意识形态,人工智能支持的攻击可能就在眼前。”站长网2023-04-12 13:23:250001