海德堡大学发布优化版本ContorlNet模型ConTorlNetXS
海德堡大学最近发布了一个名为ConTorlNetXS的优化版本的ControlNet模型,该模型在图像生成方面的性能得到了极大提升。这一项目的研究重点是控制基于稳定扩散模型的图像生成过程,通过对ControlNet的大小和架构进行优化,取得了令人瞩目的成果。
ConTorlNetXS的参数仅为原始模型的1%,但在推理和训练时间上提高了两倍,同时生成的图片质量更高,控制更加精准。研究人员将这一新架构命名为ControlNet-XS,并展示了其比原始ControlNet表现更好的结果,尤其在FID分数方面表现出色。
论文地址:https://arxiv.org/pdf/2312.06573.pdf
原始的ControlNet是基于StableDiffusion基础模型中U-Net编码器的副本,接收与基础模型相同的输入,并附加一个类似边缘图的引导信号。在训练过程中,ControlNet的中间输出添加到基础模型的解码器层的输入中。然而,这种方法存在概念上的问题,导致ControlNet过于庞大,并且生成图像的质量明显降低。
为了解决这一问题,研究人员对ControlNet进行了优化,将连接从编码器基础模型添加到控制编码器,使得纠正可以更快地适应基础模型的生成过程。然而,这一方法并未完全消除延迟,因为基础模型的编码器仍然没有受到引导。因此,他们直接将额外的连接添加到基础模型的编码器中,直接影响整个生成过程,最终实现了ControlNet-XS的优化版本。
研究人员对三种ControlNet-XS的变体(A、B、C)相对于原始的ControlNet在COCO2017的验证集上的FID分数表现进行了评估。结果显示,所有的变体都取得了显著的改进,同时只使用了原始ControlNet参数的一小部分。这一成果将为图像生成领域带来重大影响,有望推动该领域的进一步发展和应用。
中国中医科学院与阿里云合作 联合打造中医药行业大模型
近日,中国中医科学院与阿里云在北京签署合作协议,双方将共同启动数智中医创新联合实验室,并联合打造中医药行业大模型,推动中医药行业数智化。依据合作协议,双方将共同建设、运营“数智中医创新联合实验室”,面向行业联合打造中医药行业大模型—岐黄助手,围绕中医药数字化、产业化,共同搭建、推广、运营涵盖中医药服务业、中医药产业的一站式数字化云服务平台。站长网2023-08-15 18:03:140000印度科技巨头Wipro将投资10亿美元于人工智能领域 并为员工提供培训
印度软件服务提供商Wipro希望公司所有员工都掌握人工智能的使用。该公司于本周三宣布,将在未来三年内投资10亿美元来提升其人工智能能力,其中包括培训其全球66个国家、25万名员工。Wipro是印度最大的外包公司之一,专门提供IT和咨询服务。此举是在生成式人工智能(generativeAI)迅速崛起的背景下进行的。站长网2023-07-15 01:58:580000独立开发变现周刊(第111期):AI Excel公式生成器,月收入2万美元
目录1、Opengpts:开源的基于LangChain等基础上的GPTs交互式体验代码库2、sshx:开源的web协作终端3、Tally:一个简单的表单构建器,月收入7万美元4、一个AIExcel公式生成器,月收入2万美元1、Opengpts:开源的基于LangChain等基础上的GPTs交互式体验代码库站长网2023-11-10 09:20:200001苹果混合现实头戴设备的设计复杂性超乎想象 带来制造难题
站长之家(ChinaZ.com)6月1日消息:苹果的混合现实头戴设备被报道称将是该公司迄今为止最复杂的硬件产品,其独特的设计给制造带来了前所未有的挑战。站长网2023-06-01 14:54:560000比尔·盖茨预测未来人人都将拥有 AI「代理人」:人工智能将在几乎任何活动和生活的任何领域帮助用户
微软联合创始人比尔·盖茨近日对人工智能的未来做出大胆预测,他认为每个人很快都将拥有一个代表他们行动的机器人「代理人」。据《财富》杂志报道,盖茨表示:「在不远的将来,任何在线的人都将能够拥有一个由人工智能驱动的个人助手,其能力将远超今日技术。这些代理人更聪明。它们是主动的——能够在你提出要求之前就提出建议。」站长网2023-11-15 20:43:100002