CMU与Google DeepMind研究人员推出AlignProp:微调文本到图像扩散模型的创新方法
卡内基梅隆大学(CMU)和Google DeepMind的研究人员引入了一种突破性的方法,称为"AlignProp"。该方法利用直接反向传播来微调文本到图像扩散模型,解决了将这些模型与所需的奖励功能对齐的挑战。AlignProp提供了一种更高效和有效的方式来优化文本到图像扩散模型,适用于图像生成等领域。
项目地址:https://align-prop.github.io/
概率扩散模型的崛起
概率扩散模型已经成为连续领域生成建模的标准。DALLE,一种文本到图像扩散模型,已经成为该领域的领导者。这些模型以其能够通过在广泛的网络规模数据集上训练来生成图像的能力而闻名。然而,它们的无监督或弱监督性质使得在下游任务中控制其行为,如优化图像质量、图像文本对齐或伦理图像生成成为一项具有挑战性的任务。
微调扩散模型的挑战
最近的尝试使用强化学习技术来微调扩散模型受制于梯度估算中的高方差。AlignProp通过在去噪过程中启用奖励梯度的端到端反向传播,从而对这一问题提供了创新性的解决方案,将扩散模型与所需的奖励功能对齐。
AlignProp的创新特点:
AlignProp引入了一些创新特点,以提高微调扩散模型的效率:
减轻高内存需求: AlignProp通过微调低秩适配器权重模块和实施梯度检查点来减轻通常与现代文本到图像模型的反向传播相关的高内存需求。
性能评估: 研究论文评估了AlignProp在微调扩散模型以实现各种目标的性能,包括图像文本语义对齐、美学、图像可压缩性以及生成图像中对象数量的可控性等目标的性能。AlignProp在较少的训练步骤中实现了更高的奖励,胜过了其他方法。
概念上的简单性: AlignProp因其概念上的简单性而备受赞誉,使其成为基于可区分奖励函数的扩散模型优化的明智选择。
提高采样效率和计算有效性
AlignProp利用从奖励函数获得的梯度来微调扩散模型。这种方法提高了采样效率和计算有效性。实验一致表明,AlignProp在优化一系列奖励函数方面的有效性,甚至对于难以仅通过提示定义的任务也是如此。
未来的研究方向
未来,研究人员可以探索将AlignProp的原则扩展到基于扩散的语言模型,以增强其与人类反馈的一致性。
Hugging Face 发布医疗任务评估基准Open Medical-LLM
划重点:⭐️HuggingFace发布了一个新的医疗任务评估基准,旨在测试生成式人工智能模型在健康相关任务上的表现。⭐️OpenMedical-LLM基准由现有测试集拼接而成,涵盖多个医学领域,如解剖学、药理学、遗传学和临床实践。站长网2024-04-19 11:44:570000MagicGPT即将到来?荣耀持续发力AI大模型行业
凤凰网科技讯9月4日,据天眼查App显示,近日,荣耀终端有限公司申请两枚“MagicGPT”商标,国际分类为网站服务、科学仪器,当前商标状态均为申请中。图源天眼查值得一提的是,不久前,该公司已申请科学仪器类“MagicAI”商标,当前商标状态也为申请中。图源天眼查站长网2023-09-04 21:39:4900006999元起卖爆!荣耀Magic V3系列打破近一年大折叠屏首销纪录
快科技7月21日消息,荣耀MagicV3、荣耀MagicVs3两款折叠屏旗舰于7月19日全渠道开售,售价6999元起。根据荣耀终端有限公司中国区CMO姜海荣发布的首销战报,荣耀MagicV3系列打破了过去一年大折叠屏首销日销量及销售额纪录。海报显示,对比对象为2023年7月20日至2024年7月19日上市的所有大折叠屏手机。站长网2024-07-21 14:12:060000小米Civi 4Pro正式发布:售价 2999 元起 首发骁龙 8s Gen3
今日,小米全新Civi4Pro手机正式发布,定于3月26日全面开售。在设计上,小米Civi4Pro采用了前后四微曲的独特设计,提供春野绿、柔雾粉、微风蓝、星空黑四种时尚配色。其“绮彩鎏光”工艺经过16道复杂工序打磨而成,双生双色设计更是别具一格,使整机厚度仅为7.45mm,重量轻至179.3g,为用户带来极致的握持体验。站长网2024-03-22 09:35:400000单月涨粉38万,她拿下小红书2024开门红
2024年开年之际,小红书内容生态呈现出了怎样的面貌?让我们一起在春节到来之前,围观下新鲜出炉的一月涨粉榜:本月排名第一的是萌娃账号@刘格格。该账号之所能在本月迅速涨粉,源于格格与剧情博主@晨晨的“网友奔现”。面对漂亮妹妹的热烈欢迎,张典兴奋又害羞的表情令人捧腹;格格撩起刘海cos臻臻后,张典的“痛心疾首”也颇具喜感。奇妙的化学反应下,@刘格格一月涨粉38.2万,在2024年迎来了开门红。站长网2024-02-06 16:22:200000