微软开源创新LoRA组合方法,增强文生图复杂细节控制
LoRA(低秩适应)的高效能力已在文生图领域获得广泛应用,可以准确渲染、融合图像中的特定元素,例如,不同字符、特殊服装或样式背景等,同时可对图像进行压缩、去噪、补全进行优化操作。
但想在模型中应用多个LoRA构建更复杂的图像时,会出现图像失真、难以控制细节的难题。因此,微软和伊利诺伊大学的研究人员开发了Multi-LoRA Composition(多重 LoRA 组合方法)。
该方法包括LoRA Switch和LoRA Composite两种,无需微调就能集成多个LoRA一起使用,并且能保持每个LoRA 的权重完整性。
研究人员使用GPT-4V对该方法进行了综合评测,结果显示,LoRA Switch 在图像合成质量方面表现出卓越的性能,而 LoRA Composite 在图像质量生成方面表现出色,并且随着LoRA数量的增长效果将更明显。
论文地址:https://arxiv.org/abs/2402.16843
Github地址:https://github.com/maszhongming/Multi-LoRA-Composition
项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/
LoRA Switch
LoRA Switch的技术原理是在每一个消噪步骤中, 选择性地激活一个LoRA模型,同时在多个LoRA模型之间轮流切换,确保每个元素都能得到充分的渲染。
LoRA Switch主要由3大块组成:1)扩散模型,用于生成图像的基模型,并执行顺序消噪的过程;2)多个LoRA模型,每个LoRA模型专门渲染图像中的一个元素,例如,人物、服装、背景、风格等;
3)切换功能,用户控制在消噪步骤中,按需激活每一个LoRA模型。
LoRA Switch的底层运行机制包括:首先设置LoRA模型的激活顺序,如先后激活人物LoRA、服装LoRA、风格LoRA等。
然后从第一个LoRA模型开始生成图像,每隔N个消噪步骤就切换激活下一个LoRA。当切换完所有LoRA后,再从头开始新的一轮切换,直到图像最终生成。
例如,在虚拟试穿场景中,LoRA Switch会在连续的去噪步骤中轮换角色LoRA和服装LoRA,从而确保每个元素都以精确和清晰的方式呈现。
LoRA Switch可以确保每个元素都得到充分渲染,避免了直接融合LoRA权重矩阵时出现的不稳定问题,也可以灵活调整LoRA之间的切换速率,适应不同的场景。
LoRA Composite
LoRA Composite的技术原理是在每个消噪步骤计算每个LoRA的无条件和有条件分数估计。然后对这些分数进行平均,作为图像生成过程的指导。这样可以极大平衡不同LoRA的作用,实现更协调的成像合成。
LoRA Composite主要包括2大块:1)扩散模型,用于执行去噪流程;2)多个LoRA模型:对扩散模型的参数进行适应,每个LoRA负责渲染一个元素。
LoRA Composite在运行时,首先计算每个LoRA模型的无条件和条件分数估计,然后对所有LoRA模型的分数进行平均,得到一个综合分数。以这个综合分数作为指导,驱动扩散模型执行顺序消噪过程并逐步生成图像。
与LoRA Switch不同的是,LoRA Composite综合了所有LoRA,并直接影响扩散过程,而不是操纵权重矩阵。
LoRA Composite可以集成任意数量的LoRA,并突破了目前研究中通常只合并两个LoRA的技术限制。
评估数据集
研究人员还开发了首个面向LoRA组合图像生成的专业测试基准ComposLoRA。该基准包含6大类、22个LoRA模型,480个组合样本,可以全面评价不同的LoRA组合。
实验结果表明,在保证图像质量的同时,新提出的两种组合方法相比目前主流的LoRA融合技术,可以实现更协调、逼真的多元素图像生成效果。尤其是使用数量较多的LoRA组合时,生成高质量的效果更加明显。
打造好物账号的四个核心
各位村民好,我是村长。做抖音赛道赚钱,零食和百货对普通人来说,是最简单的。前段时间,我写了一篇文章是关于抖音十大热门赛道的分析,接下来,我将逐一对每个赛道进行详细的分析。文章→抖音赚钱博主的十大类型01普通人可以入局的原因今天我们就来聊聊居家百货好物的分享,大家平常看到卖垃圾袋、垃圾桶、削皮器、锅铲瓢盆等都属于。居家百货普通人为什么可以拍?我觉得原因有三:1、拍摄成本低0000秒懂生成式AI—大语言模型是如何生成内容的?
备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?要想了解这个,我们就不得不先跳出大语言模型的领域,来到机器翻译这里。传统的机器翻译方式,还是采用RNN循环神经网络。循环神经网络(RNN)是一种递归神经网络,以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接。站长网2023-09-21 14:02:270000三星新款人工智能冰箱配备 AI Family Hub+:可根据您的饮食需求设计食谱
三星公司宣布,将在新的一年推出一款具有引人注目的人工智能功能的智能冰箱。该公司计划在明年的消费电子展(CES)上展示这款名为2024Bespoke4-DoorFlexRefrigerator的产品,它配备了AIFamilyHub。图片来自Samsung站长网2023-12-28 10:19:510000美国呼吁志愿者专家帮助解决生成式 AI 风险 成立新的 NIST 人工智能公众工作组
美国正在寻求合格公众的帮助,以了解如何抓住机遇并克服与生成人工智能相关的挑战。美国商务部部长GinaRaimondo宣布,美国国家标准与技术研究院(NIST)将成立一个公众工作组,研究能够生成内容的人工智能技术,包括文本、图像、视频、音乐和代码。该工作组还将协助该机构制定相关指南,以帮助组织应对生成式人工智能技术带来的风险。站长网2023-06-26 12:31:590004腾讯:医疗AI发明专利申请突破1000件
昨日,腾讯公布数据称,在医疗健康领域,腾讯目前对外申请且公开的AI医疗相关中国发明专利总数已经累计突破1000件,涵盖医学影像、AI导辅诊、药物发现、基因应用、病案管理、药品管理、风险监控等诸多领域。站长网2023-04-27 08:48:170000