DMP技术开源,可提升AI图像预测精度
站长网2023-12-07 14:52:130阅
要点:
通过利用预训练的文本到图像扩散模型作为先验,提出了Diffusion Models as Prior(DMP)管道,用于各种像素级语义预测任务。
通过在确定性预测任务和随机文本到图像模型之间重新构建扩散过程,通过一系列插值建立输入RGB图像和输出预测分布之间的确定性映射。
通过使用低秩适应来微调预训练模型,保持了泛化性能。在包括3D属性估计、语义分割和内在图像分解在内的五个任务上的广泛实验证明了DMP的有效性。
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。

项目地址:https://shinying.github.io/dmp/
为了克服确定性任务和随机文本到图像模型之间的不一致性,研究者重新构建了扩散过程,通过插值建立了输入图像和输出预测分布之间的确定性映射。为了保持泛化性能,采用了低秩适应来微调预训练模型。实验证明,DMP在包括3D属性估计、语义分割和内在图像分解在内的多个像素级语义预测任务上表现出色,即使在有限领域训练数据的情况下,也能在任意图像上产生准确的估计,超过了现有的先进算法。
通过对10,000张卧室图像的训练,作者评估了模型在多样场景和任意图像上的域外性能,特别在卧室图像的各种风格上进行了分割评估,DMP在处理其他预训练方案无法处理的图像上表现出忠实的估计能力。
总体而言,这项研究为像素级语义预测任务引入了一种创新的先验方法,为解决领域差异问题提供了新的思路。
0000
评论列表
共(0)条相关推荐
荣耀Magic V2发布 赵明称折叠手机进入毫米级时代
荣耀公司在昨日举行的新品发布会上,正式推出了荣耀MagicV2。这款手机采用了第二代骁龙8领先版,并通过新材料和新技术的应用,将机身厚度和重量进一步降低,展现了荣耀公司在技术创新和产品设计上的不懈追求。站长网2023-07-13 21:47:410000海艺AI:一个免费且高效易用的AIGC绘图工具
海艺AI是一款国产AI绘画工具,通过AI技术提供高效易用的绘图功能。它具备12000多种风格的模型库和专业功能,如图生图、局部重绘、LoRA、ControlNet等,让用户可以进行高质量的创作。官网地址:https://www.seaart.ai/home站长网2023-07-27 11:52:0400032ChatGPT 联合创始人 Greg Brockman 在 UND 谈论人工智能的未来
站长之家(ChinaZ.com)9月28日消息:当UND校长AndrewArmacost和GregBrockman进行对话时,他估计大约有550人在听众席上。这场访谈在UND纪念联盟大厅举行,围绕着Brockman的过去和人工智能的未来展开。「我们很高兴你能来到这里,」Armacost在开始谈话时说。站长网2023-09-29 10:03:350001腾讯QQWindows 9.90体验版上线 采用全新登录以及交互界面
昨日,腾讯QQWindows9.90体验版上线,适用于Windows7SP1及以上版本,全新体验版的WindowsQQ新增了对64位系统的支持,基于NT架构,正式实现了macOS、Linux和Windows三个平台的统一。新版QQ采用了全新登录界面以及交互界面,支持表情分类和黄脸超级表情,还具备夜间模式一键开启等功能。站长网2023-07-04 15:58:100000Nature新规:用ChatGPT写论文可以,但不能列为作者
Nature针对ChatGPT代写学术文章、被列为作者等问题,给出了两项原则:任何大型语言模型工具都不能成为论文作者;如在论文创作中用过相关工具,作者应在“方法”或“致谢”或适当的部分明确说明。目前,上述要求已经添进作者投稿指南中。站长网2023-05-01 10:19:340000