FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法
站长网2024-02-21 11:19:560阅
划重点:
⭐️ FreeControl 提供一种无需训练即可控制任何文本到图像扩散模型的空间控制方法
⭐️ 支持多个条件、架构和检查点同时进行控制生成
⭐️ 通过结构和外观引导,实现对生成图像的控制
在最新的研究中,研究人员提出了一种名为 FreeControl 的方法,可以实现对文本到图像生成模型的空间控制,而无需进行训练。这项研究支持同时控制多个条件、架构和检查点,为生成过程提供了更大的灵活性。通过结构引导和外观引导,FreeControl 能够促进生成图像与指导图像的结构对齐,以及在具有和不具有控制的情况下生成的图像之间的外观对齐。

FreeControl 方法包括分析阶段和合成阶段。在分析阶段,FreeControl 通过查询文本到图像模型生成尽少一张种子图像,然后从生成的图像中构建线性特征子空间。在合成阶段,FreeControl 利用子空间中的引导来促进与指导图像的结构对齐,以及在有控制和无控制情况下生成的图像之间的外观对齐。
研究人员展示了使用 T2I 扩散模型进行可控生成的定性结果。他们展示了支持任何条件生成的能力,并通过提供代码和相关工作的引用,展示了 FreeControl 方法的有效性和广泛适用性。


FreeControl 有助于对许多不同的架构和检查点进行方便的免训练控制,允许大多数现有免训练方法失败的具有挑战性的输入条件,并通过基于训练的方法实现有竞争力的合成质量。
项目网址:https://top.aibase.com/tool/freecontrol
论文网址:https://arxiv.org/pdf/2312.07536.pdf
0000
评论列表
共(0)条相关推荐
李想:《飞驰人生2》零尿点太好看了、强推4D座椅票
快科技2月11日消息,春节档电影已经上映,截至目前,几部热门影片的首波口碑和评分均已经出炉,据豆瓣电影平台数据显示,《飞驰人生2》以8.1分的高分成为截至目前本档期评分最高的作品。该电影由韩寒导演、沈腾主演,目前已经收获了超过9700条豆瓣影评。站长网2024-02-12 09:02:220000周杰伦又救了腾讯音乐一次
“一个周杰伦撑起了半个腾讯音乐”,近十年前对腾讯音乐的调侃,如今依然成立。作为中国乐坛霸主,腾讯音乐(简称TME,1698.HK)过去打下的音乐版权江山,似乎已成其取之不尽的金矿,正在抵消社交娱乐业务的业绩震荡。8月13日港股盘后、美股盘前,腾讯音乐发布了2024年第二季度财报。虽然营业收入持续下滑了四个季度,但净利润却因为海量的音乐版权和给力的用户付费率持续上升。站长网2024-08-16 09:18:060000北大教授陈钟谈 AI 未来:逼近 AGI、融进元宇宙,开源是重中之重
去年11月底ChatGPT横空出世时,可能谁也没想到,一场规模庞大的变革将由此开启。凭借其强大的语言理解和生成能力,ChatGPT上线2个月突破1亿月活,吸引了工业界和学术界的广泛关注,以ChatGPT为代表的大模型技术更被认为开启了AI2.0时代:▶比尔·盖茨:ChatGPT有着重大的历史意义,不亚于互联网或个人电脑的诞生;0001小米SU7 Ultra支持新手等模式:限制马力 确保驾驶安全
小米汽车最近推出了其旗舰车型——小米SU7Ultra量产版,这款被誉为地表最快的四门量产车,预售价为81.49万元。该车型以其卓越的性能参数吸引了广泛关注,最大马力达到1548PS,零至百公里加速仅需1.98秒,这一数据在同级别车型中表现突出。站长网2024-11-02 11:40:210000Meta 的 Llama 2 基础模型现已在亚马逊 SageMaker JumpStart 中提供
亚马逊公司宣布,Meta开发的Llama2基础模型可通过AmazonSageMakerJumpStart向客户提供。Llama2系列大型语言模型(LLM)是预先训练和微调的生成文本模型的集合,其规模从70亿到700亿个参数不等。站长网2023-07-20 11:07:560000