FreeControl:无需训练即可控制任何文本到图像扩散模型的空间控制方法
站长网2024-02-21 11:19:560阅
划重点:
⭐️ FreeControl 提供一种无需训练即可控制任何文本到图像扩散模型的空间控制方法
⭐️ 支持多个条件、架构和检查点同时进行控制生成
⭐️ 通过结构和外观引导,实现对生成图像的控制
在最新的研究中,研究人员提出了一种名为 FreeControl 的方法,可以实现对文本到图像生成模型的空间控制,而无需进行训练。这项研究支持同时控制多个条件、架构和检查点,为生成过程提供了更大的灵活性。通过结构引导和外观引导,FreeControl 能够促进生成图像与指导图像的结构对齐,以及在具有和不具有控制的情况下生成的图像之间的外观对齐。
FreeControl 方法包括分析阶段和合成阶段。在分析阶段,FreeControl 通过查询文本到图像模型生成尽少一张种子图像,然后从生成的图像中构建线性特征子空间。在合成阶段,FreeControl 利用子空间中的引导来促进与指导图像的结构对齐,以及在有控制和无控制情况下生成的图像之间的外观对齐。
研究人员展示了使用 T2I 扩散模型进行可控生成的定性结果。他们展示了支持任何条件生成的能力,并通过提供代码和相关工作的引用,展示了 FreeControl 方法的有效性和广泛适用性。
FreeControl 有助于对许多不同的架构和检查点进行方便的免训练控制,允许大多数现有免训练方法失败的具有挑战性的输入条件,并通过基于训练的方法实现有竞争力的合成质量。
项目网址:https://top.aibase.com/tool/freecontrol
论文网址:https://arxiv.org/pdf/2312.07536.pdf
0000
评论列表
共(0)条相关推荐
12306APP改版 新增折扣信息
近日,12306APP购票页面改版。与此前页面相比,新版在查询列车信息页面可直接选购座席等级,同时显示折扣信息。目前不少铁路执行浮动票价,在公布票价的基础上,实际票价有所浮动。据中国铁路微信公众号公布数据,三季度,全国铁路发送旅客11.5亿人次,较2019年同期增长11.6%。站长网2023-12-07 12:08:190000推荐1个免费AI论文文献阅读必备神器!
包阅AI-支持论文文献阅读、文档总结、科研方法提炼、全文翻译、论文改写免费传送门:https://baoyueai.com/home?utm_id=2197711)操作极其简单包阅AI阅读工具,高效阅读助手,小白也能秒变行业专家。站长网2024-03-20 18:56:380000OpenAI全能模型GPT-4o发布 能听能看能说还免费
OpenAI最新发布了其旗舰大模型GPT-4o,该模型不仅免费可用,还具备听、看、说的综合能力,提供丝滑流畅且无延迟的交互体验,仿佛与人进行视频通话一般。GPT-4o的特点全能输入输出:GPT-4o能够接受文本、音频和图像的任意组合作为输入,并生成相应的文本、音频和图像输出。快速响应:该模型响应音频输入的时间仅为232毫秒至320毫秒,与人类对话反应速度一致。站长网2024-05-14 09:04:310000通义千问开源基于Qwen1.5的代码模型CodeQwen1.5
通义千问昨晚开源了基于Qwen1.5的代码模型CodeQwen1.5,这是一个基于Qwen语言模型的代码专家模型。CodeQwen1.5拥有7B参数,采用GQA架构,经过约3Ttokens代码数据的预训练,支持92种编程语言,并且能够处理最长64K的上下文输入。站长网2024-04-18 16:16:590000苹果推送 iOS 17.2 正式版 新增“手记”应用等
在今日凌晨的更新中,苹果正式发布了iOS17.2,作为iOS17的第二次大版本更新,此次更新带来了许多新的功能和错误的修复。站长网2023-12-12 09:13:430002