阿里巴巴通义实验室开源AI图像生成微调框架SCEdit
站长网2024-01-05 09:09:100阅
SCEdit 是一个高效的生成式微调框架,由阿里巴巴通义实验室基础视觉智能团队提出。该框架可以用于图像生成任务的微调,并支持快速迁移到特定的生成场景中。相比于其他方法,SCEdit 能够节省30%-50% 的训练显存开销。
该框架的核心思想是利用 U-Net 中的跳跃连接进行编辑,通过调整跳跃连接上的中间特征来实现高效的微调。SCEdit 还引入了名为 SC-Tuner 的轻量级微调模块,可以在编码器和解码器之间聚合远距离信息,从而提升图像生成的内容和质量。
除了支持文生图下游任务的微调,SCEdit 还可以直接扩展到可控图像生成任务中。通过注入不同的条件,如边缘图、深度图、分割图、姿态、颜色图等,可以实现对生成结果的精准控制。而且,仅需使用 ControlNet 条件生成7.9% 的参数量,并节省30% 的显存开销。
SCEdit 在文生图和可控图像生成任务上进行了广泛实验,结果表明该方法在效率和性能方面具有优势。在文本到图像生成任务中,SCEdit 的 FID 得分和质量结果优于现有方法,并在训练阶段减少了52% 的内存消耗。在可控生成任务中,SCEdit 可以实现对生成结果的精准控制,并节省30% 的内存使用。
项目地址:https://github.com/ali-vilab/SCEdit
新鲜AI产品点击了解:https://top.aibase.com/
0000
评论列表
共(0)条相关推荐
家长必看!腾讯防沉迷功能 1:身份证查孩子游戏登录、充值
快科技8月13日消息,今日,腾讯公众号发文,称身份证关联游戏账号查询来了,防沉迷功能1。相信很多家长都烦恼,家里小孩悄悄使用家长的账号玩游戏,或是担心小孩给游戏充值,自己毫不知情。有了这项功能,家长就可以查询此身份证账号下,一个月内所有腾讯游戏账号登录、充值状态,而且还能实时通知。站长网2024-08-15 16:41:150000LLM360: 首个完全开源和透明的大语言模型
**划重点:**1.🌐开源LLMs(如LLaMA、Falcon和Mistral)选择性公开了组件,而LLM360计划通过完全开源训练过程,支持AI研究的透明性和可重复性。2.🚀LLM360发布两个7B参数的LLMs,AMBER和CRYSTALCODER,附带训练代码、数据、中间检查点和分析,旨在推动开源LLMs的全面透明。站长网2023-12-14 12:01:040001前妙鸭产品经理张月光创业公司「沐言智能」获近3亿融资
据报道,前阿里产品经理张月光离职创业后,其创立的新公司「北京沐言智语科技有限公司」已经进行四轮融资,融资金额接近3亿人民币。这一消息在业内引起轰动,尤其是在当前资本市场环境下,这样的融资规模十分罕见。0000实时识别物体的模型YOLOv10升级:识别延迟减少46%
划重点:🔥YOLOv10是一种实时识别物体的模型,v10相比v9版本,参数降低25%,识别延迟减少46%。🔥YOLOv10通过消除非最大抑制(NMS)的依赖性,实现了无NMS的训练和低推理延迟。🔥YOLOv10采用了综合的效率-准确性驱动模型设计策略,从效率和准确性两个角度对YOLOs的各个组件进行了全面优化。站长网2024-05-27 19:35:520001这届双11,奢侈品只配给年轻人凑单
最近,拉夫劳伦的电商员工,可能经历了冰火两重天,店铺商品被人疯狂抢购后,又立刻遭遇了批量退款;范思哲、Burberry、迪奥等品牌,也有相似境遇。这些奢侈大牌,之所以遇上“渣男渣女”,是因为成了网友反向凑单工具;毕竟,价格适合、退款及时、退货方便的美德,很容易得到省钱达人青睐。站长网2023-11-10 09:20:180000