海德堡大学发布优化版本ContorlNet模型ConTorlNetXS
海德堡大学最近发布了一个名为ConTorlNetXS的优化版本的ControlNet模型,该模型在图像生成方面的性能得到了极大提升。这一项目的研究重点是控制基于稳定扩散模型的图像生成过程,通过对ControlNet的大小和架构进行优化,取得了令人瞩目的成果。
ConTorlNetXS的参数仅为原始模型的1%,但在推理和训练时间上提高了两倍,同时生成的图片质量更高,控制更加精准。研究人员将这一新架构命名为ControlNet-XS,并展示了其比原始ControlNet表现更好的结果,尤其在FID分数方面表现出色。

论文地址:https://arxiv.org/pdf/2312.06573.pdf
原始的ControlNet是基于StableDiffusion基础模型中U-Net编码器的副本,接收与基础模型相同的输入,并附加一个类似边缘图的引导信号。在训练过程中,ControlNet的中间输出添加到基础模型的解码器层的输入中。然而,这种方法存在概念上的问题,导致ControlNet过于庞大,并且生成图像的质量明显降低。
为了解决这一问题,研究人员对ControlNet进行了优化,将连接从编码器基础模型添加到控制编码器,使得纠正可以更快地适应基础模型的生成过程。然而,这一方法并未完全消除延迟,因为基础模型的编码器仍然没有受到引导。因此,他们直接将额外的连接添加到基础模型的编码器中,直接影响整个生成过程,最终实现了ControlNet-XS的优化版本。
研究人员对三种ControlNet-XS的变体(A、B、C)相对于原始的ControlNet在COCO2017的验证集上的FID分数表现进行了评估。结果显示,所有的变体都取得了显著的改进,同时只使用了原始ControlNet参数的一小部分。这一成果将为图像生成领域带来重大影响,有望推动该领域的进一步发展和应用。
董宇辉称高考不决定人生:人生是一场漫长的“马拉松”
高考的脚步日益临近,在这个关键的时刻,董宇辉为即将踏上考场的高考学子们带来了四点宝贵的建议,鼓励他们在人生的这场“马拉松”中稳扎稳打,不忘初心。首先,董宇辉强调了复习功课的重要性。他建议学子们要充分利用最后的复习时间,巩固所学知识,查漏补缺,确保在考试中能够发挥出自己的最佳水平。站长网2024-06-04 14:52:520001重磅!新语言Mojo开放下载,运行速度超Python6.8万倍
要点:新语言Mojo开放编译器和IDE下载,语法类Python但运行速度可达Python的68000倍。Mojo通过类型注释、向量化、多核并行等手段大幅提升运行速度。Mojo兼容Python生态,可与Numpy、Pandas等库无缝交互,受到AI开发者关注。站长网2023-09-08 17:02:530002人工智能让 Google 地图变得越来越像「搜索引擎」
站长之家(ChinaZ.com)10月27日消息:Google正在为其地图服务增加一系列新的人工智能(AI)驱动功能,包括更沉浸式的导航、更易于遵循的驾驶指示和更好组织的搜索结果。最终效果将让许多用户感觉到Google地图的体验与Google搜索相似。站长网2023-10-27 20:45:530001Meta AI 负责人:当前的 ChatGPT 等人工智能还不如狗聪明
当前的人工智能系统(如ChatGPT)并没有人类级别的智能,甚至不如狗聪明。这是Meta的AI负责人在关于这种快速发展技术危险的论坛中表示的。ChatGPT是由OpenAI开发的,它基于所谓的大型语言模型。这意味着该AI系统经过大量的语言数据训练,用户可以通过问题和请求与其进行对话,而聊天机器人则用我们能理解的语言回答。站长网2023-06-16 16:45:180000苹果喊话钉子户:等等党们是时候换iPhone16 Pro了 全方位升级
苹果公司今日通过其官方公众号发布消息,标题引人瞩目:“iPhone等等党,是时候了”。在这篇文章中,苹果宣布iPhone16Pro在多个方面进行了显著升级,暗示iPhone13Pro和iPhone14Pro的用户现在可以考虑升级到最新的iPhone16Pro。站长网2024-11-14 16:33:560000