微软最新研究!无需训练即可融合多个Lora且保留了效果
站长网2024-02-27 16:58:121阅
微软的最新研究成果在图像生成领域引起了广泛关注。他们提出了一种全新的文本至图像生成方法,这种方法采用了多重低秩适应(Low-Rank Adaptations, LoRAs)技术,能够创造出高度个性化且细节丰富的图像。
该项目的特色在于其免训练方法。LoRA开关和LoRA组合支持动态精确地整合多个LoRA,无需进行微调。这种方法不同于那些融合LoRA权重的做法,而是专注于解码过程,并保持所有LoRA权重不变。这种创新的方法使得在生成复杂图像组合的场景中,该方法的性能显著优于现有的LoRA合并技术。
项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/
此外,微软还推出了一个全新的综合性测试平台——ComposLoRA。该平台包含480套组合和22个在六大类别中预训练好的LoRA,专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。
微软还提出了采用GPT-4V作为评估工具,用以判定组合效果及图像质量。该评估工具已证实在与人类评价的相关性上有更好的表现。无论是自动化还是人类评价,微软的方法都显著优于现有的LoRA合并技术。
微软对每种方法在不同场景下的优势进行了深入的分析,并探讨了采用GPT-4V作为评估工具可能存在的偏差。这种详尽的分析为图像生成领域的研究提供了重要的参考。
总的来说,微软的这项研究成果在图像生成领域具有重要意义。他们的免训练方法、全新的测试平台以及基于GPT-4V的评估工具,都为图像生成技术的发展提供了新的思路和工具。
0001
评论列表
共(0)条相关推荐
美版贴吧数据不让大模型白嫖了!年费2000万,Stable Diffusion等上百个社区炸锅:暂停服务
Reddit:我们的目标就三个,搞钱、搞钱、还是**的搞钱!不想被白嫖的Reddit正式向马斯克的Twitter看齐。继今年4月公布将向科技公司收费的公告后,近期Reddit也透露面向第三方应用API定价。站长网2023-06-07 20:02:4600000.2美元微调就能让ChatGPT彻底破防!普林斯顿、斯坦福发布LLM风险预警:普通用户微调也影响LLM安全性
【新智元导读】微调LLM需谨慎,用良性数据、微调后角色扮演等都会破坏LLM对齐性能!学习调大了还会继续提高风险!虽说预训练语言模型可以在零样本(zero-shot)设置下,对新任务实现非常好的泛化性能,但在现实应用时,往往还需要针对特定用例对模型进行微调。不过,微调后的模型安全性如何?是否会遗忘之前接受的对齐训练吗?面向用户时是否会输出有害内容?站长网2023-10-13 14:45:190000“云养老”的年轻人,再次爱上鉴宝直播
“故宫一对我一对”“来靠近点我看看……东西是老的一眼大开门(真货)”最近,抖音平台上的鉴宝直播再次出圈,@海东鉴宝、@听泉寻宝等博主与宝友(指文玩玉石爱好者)直播连线鉴宝,节目效果十足,引起广大网友关注。早在二十多年前,鉴宝节目在电视上就已经有很多忠实观众。王刚主持的《天下收藏》就因为会在“护宝”环节砸掉所谓的“赝品”而噱头十足。站长网2024-02-02 11:07:190000孟晚舟当值董事长首秀 称数字化是全产业链的新蓝海
华为CFO兼轮值董事长孟晚舟在第20届华为全球分析师大会上作为轮值董事长首次公开亮相。本次大会以“数字生产力飞跃,加速迈向智能世界”为主题,分享了华为对智能世界的愿景,探讨了行业发展方向。孟女士出任轮值董事长意义重大,因为她是在最近的董事会选举中被任命担任该职务的。会议还强调了华为在数字基础设施方面的持续投资以及帮助客户实现数字化转型的承诺。站长网2023-04-20 09:38:350000「人工智能教母」李飞飞谈技术发展:「力量在于人」
斯坦福大学人工智能实验室主任、被誉为「人工智能教母」的李飞飞教授,在人工智能领域贡献了20余年,不仅开发了开创性技术,还积极倡导其在伦理方面的应用。目前,李飞飞领导斯坦福大学的人工智能实验室,带领研究生团队教导机器人模仿人类行为。她还发起了一项倡议,主张所有人工智能都应由人推动,并将这一信息带到了国会。站长网2023-11-09 15:59:450000