19287

微软最新研究！无需训练即可融合多个Lora且保留了效果

站长网2024-02-27 16:58:121阅

微软的最新研究成果在图像生成领域引起了广泛关注。他们提出了一种全新的文本至图像生成方法，这种方法采用了多重低秩适应（Low-Rank Adaptations， LoRAs）技术，能够创造出高度个性化且细节丰富的图像。

该项目的特色在于其免训练方法。LoRA开关和LoRA组合支持动态精确地整合多个LoRA，无需进行微调。这种方法不同于那些融合LoRA权重的做法，而是专注于解码过程，并保持所有LoRA权重不变。这种创新的方法使得在生成复杂图像组合的场景中，该方法的性能显著优于现有的LoRA合并技术。

项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/

此外，微软还推出了一个全新的综合性测试平台——ComposLoRA。该平台包含480套组合和22个在六大类别中预训练好的LoRA，专为评估基于LoRA的可组合图像生成任务而设计，支持定量评估。

微软还提出了采用GPT-4V作为评估工具，用以判定组合效果及图像质量。该评估工具已证实在与人类评价的相关性上有更好的表现。无论是自动化还是人类评价，微软的方法都显著优于现有的LoRA合并技术。

微软对每种方法在不同场景下的优势进行了深入的分析，并探讨了采用GPT-4V作为评估工具可能存在的偏差。这种详尽的分析为图像生成领域的研究提供了重要的参考。

总的来说，微软的这项研究成果在图像生成领域具有重要意义。他们的免训练方法、全新的测试平台以及基于GPT-4V的评估工具，都为图像生成技术的发展提供了新的思路和工具。

微软最新研究无需训练即可融合多个Lora且保留了效果

0001

评论列表

共(0)条

相关推荐

站长资讯
医学研究者发出紧急警告:AI生成大量健康虚假信息
**划重点:**1.🚨医学研究表明，生成式人工智能（GenerativeAI）可轻松制造大量健康虚假信息，引发社区关切。2.🌐通过使用GenerativeAI工具，研究团队在短短一小时内生成了超过100篇具有误导性的博客、20张欺骗性图片，以及一段令人信服的深度伪造视频，声称健康虚假信息。
站长网2023-11-14 14:53:29
0002
站长资讯
百度发布智能计算操作系统万源支持77款大模型
在2024年百度CreateAI开发者大会的盛会上，百度集团执行副总裁、百度智能云事业群总裁沈抖发布了百度智能云万源全新一代智能计算操作系统。据悉，这款操作系统的内核设计独具匠心，不仅集成了百度文心大模型等一系列特色鲜明的大模型，更具备对其他第三方大模型产品的兼容能力，从而全面满足了业界对大模型使用的多样化需求。具体支持了包括文心一言、第三方大模型在内的77个大模型。
站长网2024-04-18 21:55:54
0000
站长资讯
贾扬清周末项目Lepton Search登顶GitHub热榜 500行代码打造
要点:1、LeptonSearch是一款使用500行代码打造的AI搜索引擎，旨在向开发者展示简洁高效的实现方式。2、AI搜索引擎的复杂性仍然存在，LeptonSearch之所以能实现500行代码就完成一个产品的雏形，是因为调用了自家云上部署的开源模型和数据存储。3、AI搜索引擎在当前行业中具有重要地位，一些大公司和创业项目都在不同程度上探索和应用AI搜索技术。
站长网2024-01-29 15:11:24
0001
站长资讯
研究人员推出SuGaR:单个GPU只需几分钟即可将图像转换为3D模型
**划重点:**🌐通过SuGaR方法，法国LIGM实验室的研究人员成功在单个GPU上实现了几分钟内从3D高斯泼溅表示中提取准确可编辑的网格模型。🚀SuGaR创新地结合了神经场景表示和计算几何技术，通过泊松曲面重建迅速生成详细的三角形网格模型。
站长网2023-11-28 16:04:07
0000
站长资讯
一场脑机接口的大赛，看到时代需要的「AI超级底座」
「AI超级底座」有什么价值?小到一场竞赛，大到整个产业。从2022年开始，大模型就成为了最热门的技术关键词，这种热度显然辐射到了多个相关领域。比如，在近日召开的2023世界机器人大会上，「大模型机器人」就成为现场讨论最多的话题。
站长网2023-08-23 18:08:42
0000