图像编辑EditGAN新方法:实现高精度细节编辑 并保持图像质量
文章概要:
1. EditGAN 是高精度语义图像编辑的新方法,解决传统GAN的局限
2. EditGAN 通过嵌入图像到GAN的潜在空间进行精确编辑,学习“编辑向量”
3. EditGAN 可以进行高精度编辑,同时保持图像质量,表现超过其他模型
近年来,生成对抗网络(GAN)在图像编辑领域得到广泛应用。但是传统GAN架构存在一些局限,如需要大量标注数据、编辑控制粒度较粗等。为解决这些问题,NVIDIA 在2022年提出了EditGAN。
EditGAN是一种高精度、高质量语义图像编辑的新方法。它基于一种GAN框架,可以同时建模图像及其语义分割,只需要很少的标注数据。
EditGAN通过优化将图像嵌入到GAN的潜在空间,然后根据分割编辑进行条件潜码优化,以精确修改图像。为了缩短优化过程,模型会在潜在空间中找到实现编辑的“编辑向量”。

EditGAN框架可以学习任意数量的编辑向量,然后可以高效地应用于其他图像。实验结果表明,EditGAN可以在保持图像质量的同时,以前所未有的细节进行图像编辑。相比其他模型,EditGAN可以进行更复杂、更精细的编辑,同时保持身份信息及图像质量。

上图展示了 EditGAN 框架在新颖图像上应用先前学习的编辑向量并使用30个优化步骤细化图像时的性能。
为了评估 EditGAN 的域外性能,该框架已在 MetFaces 数据集上进行了测试。EditGAN 模型使用域内真实面孔来创建编辑向量。然后,该模型使用100步优化过程嵌入域外的 MetFaces 肖像,并通过30步自我监督细化过程应用编辑向量。结果如下图所示。

简单的说,EditGAN是第一个基于 GAN 的图像编辑框架,它提供了如下功能:
非常高精度的编辑。
可以处理少量标记数据。
可以在实时场景中有效部署。
允许同时进行多个编辑的组合性。
适用于 GAN 生成的、真实的嵌入图像,甚至域外图像。
此外,EditGAN 提供了三种不同的编辑模式:使用预学习的编辑向量实时编辑、使用自监督优化refine向量编辑、从头开始优化进行大范围编辑的全优化编辑。定量结果显示,在保持语义正确性及身份信息的同时,EditGAN也可以生成高质量的编辑结果。
EditGAN是语义图像编辑领域的重要进展,可以进行高精度编辑,其性能也超过当前其他模型。它很可能成为这个领域的新标准。
由于 EditGAN 基于 GAN 框架,因此它与任何其他 GAN 模型具有相同的限制:它只能处理可由 GAN 建模的图像。EditGAN 在处理 GAN 建模图像方面的局限性是难以跨不同场景实现 EditGAN 的主要原因。然而,值得注意的是,EditGAN 的高精度编辑可以通过利用编辑向量轻松转移到其他不同的图像。
EditGAN特点总结如下:
1. 基于GAN框架,只需要很少的标注数据即可进行高精度语义图像编辑
2. 通过将图像嵌入GAN的潜在空间,学习“编辑向量”来修改图像
3. 可以学习任意数量的编辑向量,高效应用到其他图像上
4. 可以进行前所未有的细节编辑,同时保持图像质量
5. 提供实时编辑向量编辑、自我监督向量编辑、全优化编辑三种编辑模式
6. 定量结果显示在保证语义和身份信息正确的同时,也可以生成高质量结果
内容参考自:https://www.unite.ai/high-precision-semantic-image-editing-with-editgan/
庄俊:撕开小红书家居流量,10倍增长背后
│前言│家居企业入局小红书,有多少个困难?怎么布局?怎么做内容?怎么做账号,怎么投流?为啥限流?怎么做品牌建设?相信这是绝大部分商家以及企业遇到的问题。如今实体线下的流量,直线下滑,家居家装行业的实体经营,变得举步维艰,因为年轻人的购买习惯变了,更倾向在线上获取信息和消费。站长网2024-01-24 09:31:520000AI改造直播间
“欢迎xx来到直播间”“我们这款产品……”凌晨,打开抖音、淘宝、携程等平台,仍然有主播在直播间循环介绍着店里的几款商品。但她们略显机械的语句停顿与固定的几个手势循环,可以看出,这些主播并不是真人出镜,而是AI数字人。AI浪潮下,虚拟主播在今年618之际加速卷入直播间。站长网2023-06-14 13:54:310000我在直播间“卖鱼”,一年卖出8个亿
在拥有千年饮食文化的中国,一道菜就能成就一个赛道。这道诞生于重庆的川菜——酸菜鱼,因为口感丰富、做法独特,从上世纪90年代开始风靡全国,成为大小饭店中一道经典名菜。酸菜鱼成为餐桌爆品后,线下也出现了多家主打这道菜的餐饮店,例如太二酸菜鱼、鱼你在一起等品牌。凭借“吃货”对酸菜鱼的喜爱和消费,太二品牌在2018年中国酸菜鱼市场排名第一,为母公司九毛九贡献了超四成营收,助其于2020年1月成功上市。站长网2023-04-23 09:21:510000阿里云:通义千问API日调用量破亿 企业用户破9万
在今日的阿里云AI智领者峰会上,阿里云首席技术官(CTO)周靖人揭晓了一项令人瞩目的数据:通义千问的API日调用量已强势突破亿次大关,企业用户数也成功跃过9万家,开源模型下载量更是达到了惊人的700万次。站长网2024-05-09 16:42:490001阅文集团拟收购腾讯动漫业务及资产 扩容升级IP生态链
昨日,阅文集团发布《有关收购资产之关联交易》公告,称将以人民币6亿元代价收购腾讯动漫旗下包含腾讯动漫App平台、其作品知识产权与相关权利、动画及影视项目等在内的相关业务及IP资产。收购完成后,阅文将整合腾讯动漫有影响力的头部IP和成熟的动漫产能,阅文的IP生态链或将迎来扩容升级。站长网2023-12-12 09:06:200000