微软最新研究!无需训练即可融合多个Lora且保留了效果
站长网2024-02-27 16:58:120阅
微软的最新研究成果在图像生成领域引起了广泛关注。他们提出了一种全新的文本至图像生成方法,这种方法采用了多重低秩适应(Low-Rank Adaptations, LoRAs)技术,能够创造出高度个性化且细节丰富的图像。
该项目的特色在于其免训练方法。LoRA开关和LoRA组合支持动态精确地整合多个LoRA,无需进行微调。这种方法不同于那些融合LoRA权重的做法,而是专注于解码过程,并保持所有LoRA权重不变。这种创新的方法使得在生成复杂图像组合的场景中,该方法的性能显著优于现有的LoRA合并技术。
项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/
此外,微软还推出了一个全新的综合性测试平台——ComposLoRA。该平台包含480套组合和22个在六大类别中预训练好的LoRA,专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。
微软还提出了采用GPT-4V作为评估工具,用以判定组合效果及图像质量。该评估工具已证实在与人类评价的相关性上有更好的表现。无论是自动化还是人类评价,微软的方法都显著优于现有的LoRA合并技术。
微软对每种方法在不同场景下的优势进行了深入的分析,并探讨了采用GPT-4V作为评估工具可能存在的偏差。这种详尽的分析为图像生成领域的研究提供了重要的参考。
总的来说,微软的这项研究成果在图像生成领域具有重要意义。他们的免训练方法、全新的测试平台以及基于GPT-4V的评估工具,都为图像生成技术的发展提供了新的思路和工具。
0000
评论列表
共(0)条相关推荐
谷歌版ChatGPT支持中文了!弱智吧实测结果在此
Claude2发布之后,Google也按耐不住,立马官宣了Bard的船新版本。支持的语言变多了,其中就包括中文,让广大网友直接喜提新玩具。总结一下这次更新,主要包括这些内容:支持包括中文在内的40多种语言(含图形界面)图像识别,需要在账号设置中将显示语言改为英语对话朗读聊天记录和对话分享,代码可导出到Replit回复内容可编辑不过在官宣的这些内容之外,似乎有网友发现了华点:站长网2023-07-16 05:52:230001预测到 2030 年,人工智能将在美国取代 240 万个工作岗位
文章概要:1.分析报告显示,生成AI将在2030年之前替代240万美国工作岗位,同时影响其他1100万岗位,但其他形式的自动化将导致更多的工作丧失。2.预测生成AI将对白领工作产生深刻影响,特别是技术写作、社会科学研究助手、校对员、文案撰写员和行政职位。3.创意产业工作者,如编辑、作家、作者和诗人,更有可能在其工作中使用生成AI工具,相对不容易被替代。站长网2023-09-07 17:48:560000谷歌工程师警告说大型科技公司可能会在人工智能竞赛中输给开源技术
谷歌公司一位工程师警告称,该公司没有赢得人工智能竞赛的能力,可能会输给普遍可得的开源人工智能技术。站长网2023-05-06 12:06:380000《时代周刊》网站关闭付费墙,探索新的盈利模式
据国外媒体报道,时代周刊官网已移除付费墙,以便扩大读者规模。这与其他出版商形成鲜明对比,因为付费阅读模式成为趋势。站长网2023-05-12 20:26:570000为什么研究章鱼、乌贼
光明图片/视觉中国光明图片/视觉中国光明图片/视觉中国光明图片/视觉中国对生物学家来说,章鱼和乌贼不仅仅是种动物,更是研究神经系统复杂性和演化的绝佳对象。它们曾经为神经科学的崛起立下过汗马功劳,但在过去的数十年间,因为和人类差别过大、研究手段限制等原因,逐渐沉寂。近年来,随着人工智能、基因编辑技术等新研究手段的发展,它们重新受到研究者的关注。在这方面,中国科学家已经走在前列。站长网2023-05-24 11:25:290001