海德堡大学发布优化版本ContorlNet模型ConTorlNetXS
海德堡大学最近发布了一个名为ConTorlNetXS的优化版本的ControlNet模型,该模型在图像生成方面的性能得到了极大提升。这一项目的研究重点是控制基于稳定扩散模型的图像生成过程,通过对ControlNet的大小和架构进行优化,取得了令人瞩目的成果。
ConTorlNetXS的参数仅为原始模型的1%,但在推理和训练时间上提高了两倍,同时生成的图片质量更高,控制更加精准。研究人员将这一新架构命名为ControlNet-XS,并展示了其比原始ControlNet表现更好的结果,尤其在FID分数方面表现出色。

论文地址:https://arxiv.org/pdf/2312.06573.pdf
原始的ControlNet是基于StableDiffusion基础模型中U-Net编码器的副本,接收与基础模型相同的输入,并附加一个类似边缘图的引导信号。在训练过程中,ControlNet的中间输出添加到基础模型的解码器层的输入中。然而,这种方法存在概念上的问题,导致ControlNet过于庞大,并且生成图像的质量明显降低。
为了解决这一问题,研究人员对ControlNet进行了优化,将连接从编码器基础模型添加到控制编码器,使得纠正可以更快地适应基础模型的生成过程。然而,这一方法并未完全消除延迟,因为基础模型的编码器仍然没有受到引导。因此,他们直接将额外的连接添加到基础模型的编码器中,直接影响整个生成过程,最终实现了ControlNet-XS的优化版本。
研究人员对三种ControlNet-XS的变体(A、B、C)相对于原始的ControlNet在COCO2017的验证集上的FID分数表现进行了评估。结果显示,所有的变体都取得了显著的改进,同时只使用了原始ControlNet参数的一小部分。这一成果将为图像生成领域带来重大影响,有望推动该领域的进一步发展和应用。
YouTube新规定要求创作者披露视频中使用AI技术部分
YouTube日前宣布,现要求创作者向观众披露视频内容中使用人工智能技术制作的部分。该平台在CreatorStudio中引入了新的工具,当观众可能误认为视频中的人物、场景或事件是真实的,而实际上通过AI技术如修改、合成等方式制作时,创作者必须进行标注。站长网2024-03-19 11:57:580000英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑
**划重点:**1.🌐Nemotron-4是英伟达最新的通用大模型,拥有150亿参数,在各语言和编码任务中表现出色。2.💡该模型采用Chinchilla模型的「缩放定律」,通过优化计算预算、数据和模型大小实现性能提升。3.🔥在多领域下游评估中,Nemotron-415B超越同等参数规模的模型,甚至击败4倍大的模型,成为最强通用语言模型。站长网2024-02-29 15:00:520000天猫官宣双11时间:10月24日晚8点开启
今日,天猫发言人”官方公众号正式宣布,天猫双11将于10月24日晚8点正式开启。在官宣文案中,官方并没有公布出具体的玩法,不过写道“不止满减、直降、买贵必赔、史上最优惠”等。据悉,今年淘天集团在天猫双11启动会上,把“全网最低价”定为核心目标,包括三大行业发展中心和用户、平台、直播等横向部门,都明确“全网最低价”为核心KPI。站长网2023-10-14 14:29:560000OPPO Find X8 Pro明日发布:搭载行业唯一双潜望镜头系统
OPPOFindX8Pro即将在明天的发布会上正式亮相,这款手机已经引起了市场的广泛关注。作为OPPO的旗舰产品,FindX8Pro搭载了行业唯一的双潜望镜头系统,其中一颗镜头专注于拍摄更远的风景,另一颗则专注于更美丽的人像摄影。站长网2024-10-23 10:11:060000阿里云盘6.0即将发布:全新推出三方应用权益包
近日,阿里云盘官方发布了关于6.0版本升级的预告,预计将在6月底正式上线。此次升级不仅涵盖了产品功能的全面优化,还为用户带来了丰富的会员权益升级,但同时也意味着部分功能将停止服务。站长网2024-06-25 12:09:490001