DMP技术开源,可提升AI图像预测精度
站长网2023-12-07 14:52:130阅
要点:
通过利用预训练的文本到图像扩散模型作为先验,提出了Diffusion Models as Prior(DMP)管道,用于各种像素级语义预测任务。
通过在确定性预测任务和随机文本到图像模型之间重新构建扩散过程,通过一系列插值建立输入RGB图像和输出预测分布之间的确定性映射。
通过使用低秩适应来微调预训练模型,保持了泛化性能。在包括3D属性估计、语义分割和内在图像分解在内的五个任务上的广泛实验证明了DMP的有效性。
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。
项目地址:https://shinying.github.io/dmp/
为了克服确定性任务和随机文本到图像模型之间的不一致性,研究者重新构建了扩散过程,通过插值建立了输入图像和输出预测分布之间的确定性映射。为了保持泛化性能,采用了低秩适应来微调预训练模型。实验证明,DMP在包括3D属性估计、语义分割和内在图像分解在内的多个像素级语义预测任务上表现出色,即使在有限领域训练数据的情况下,也能在任意图像上产生准确的估计,超过了现有的先进算法。
通过对10,000张卧室图像的训练,作者评估了模型在多样场景和任意图像上的域外性能,特别在卧室图像的各种风格上进行了分割评估,DMP在处理其他预训练方案无法处理的图像上表现出忠实的估计能力。
总体而言,这项研究为像素级语义预测任务引入了一种创新的先验方法,为解决领域差异问题提供了新的思路。
0000
评论列表
共(0)条相关推荐
李飞飞团队推手部动捕系统DexCap 泡茶剪纸轻松完成
要点:李飞飞团队开发了成本仅3600美元的便携式手部动捕系统DexCap,能让机器人完成各种花样任务。DexCap系统利用SLAM、电磁场和3D观察实时追踪手部运动,配合新算法DEXIL,实现了精确的手部动作模拟。DexIL框架通过人手动作捕捉数据训练机器人,克服了手部尺寸差异和视觉差距等挑战,使机器人能够学习复杂的操作技能。站长网2024-03-15 18:03:300000成魔还是成佛?面对科技狂潮,内容行业要有一颗人文之心
“新的技术导致新的市场,而新的市场会改变我们每一个人的生活,而新的生活又将会带来新的人文……那么,科技将如何改写人类文明的未来?”12月1日,2023腾讯ConTech大会“新人文”分论坛上,科学作家、译者季燕江提出了一个现实且前沿的开放性议题。0000百度万象大会2024 百度:已有11%的搜索内容由AI生成
2024年5月30日,百度集团在苏州盛大举办了移动生态万象大会。在这场科技盛会上,百度集团资深副总裁、移动生态事业群组总经理何俊杰深入阐述了智能体在当今社会的核心地位,他强调:“智能体不仅是生产力的新引擎,更是每个人放大自身能力、把握时代红利、成为超级个体的关键。”站长网2024-05-30 16:49:330000霉霉憨豆讲中文、蔡明阿姨秀英语,能让你说任何语种的AI神器火了
如果你平时玩微博、逛B站,最近肯定被一条“没有译制片腔调的翻译”视频刷屏过。影片中,霉霉、特朗普、艾玛沃森、憨豆先生等一众外国友人操着流利的中文,口型语气声线无缝衔接,毫无违和;而以塑造“毒舌女王”角色著称的蔡明阿姨,则来了个如假包换的英文脱口秀,听口音还是伦敦市区的。还没看的朋友可以点开感受一下:站长网2023-10-26 14:15:050000独家|抖音外卖再调整:上线随心团,到家到店统一入口
Tech星球独家获悉,抖音外卖业务从电商部门回归生活服务部门后,对原有的外卖经营方式进行调整,将原团购配送业务升级为“随心团”业务,即同一件团购商品既支持用户到店核销,也支持配送到家。原“团购配送”业务将于2024年11月1日起逐步向”随心团“业务迁移。0000