图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量
站长网2024-03-11 10:00:062阅
还记得DragGAN吗?这是一种可以拖动锚点进行图像编辑的技术,但当时代码发布后,由于生成速度慢,且不能自定义外部图片,逐渐被人们淡忘。
但现在,一种新的技术StableDrag出现了,它是基于Diffusion模型的,也能完成类似的拖动锚点编辑图片的功能。如果它的实际效果真的如演示的那样,那图片编辑将变得非常方便。
项目地址:https://top.aibase.com/tool/stabledrag
自从DragGAN出现以来,基于点的图像编辑引起了显著的关注。最近,DragDiffusion通过将这种拖动技术适配到扩散模型中,进一步推进了生成质量。然而,尽管取得了巨大的成功,但这种拖动方案存在两个主要缺点:不准确的点跟踪和不完整的运动监督,这可能导致拖动效果不理想。
为了解决这些问题,我们设计了一种判别式点跟踪方法和一种基于置信度的潜在增强策略,构建了一个稳定和精确的基于拖动的编辑框架,称为StableDrag。其中,判别式点跟踪方法允许我们精确定位更新的控制点,从而提高长距离操作的稳定性;而基于置信度的潜在增强策略则负责确保优化后的潜在表示在所有操作步骤中都尽可能保持高质量。
得益于这些独特的设计,我们实现了两种类型的图像编辑模型:StableDrag-GAN和StableDrag-Diff。通过在DragBench上进行广泛的定性实验和定量评估,证明了这两种模型能够实现更稳定的拖动性能。
0002
评论列表
共(0)条相关推荐
AI生成视频入局新卷王,上线不到48小时,网友“大片”刷屏X
AI视频生成工具卷起来了!本周二,StabilityAI低调发布了首个开源AI视频模型StableVideoDiffusion(以下简称SVD),同时还晒出测试数据称,SVD的模型性能碾压RunwayML、PikaLabs等领先的闭源商业模型。站长网2023-11-25 13:43:170009工信部:我国5G手机用户达8.05亿户 加快6G技术研究
快科技1月19日消息,据媒体报道,工业和信息化部表示,截至2023年底,5G移动电话用户达8.05亿户,5G网络接入流量占比达47%。目前,我国5G技术产业在技术标准、网络设备、终端设备等方面创新能力不断增强。轻量化5G核心网、定制化基站等实现商用部署。5G工业网关、巡检机器人等一批新型终端成功研发。5G标准必要专利声明量全球占比超42%,持续保持全球领先。站长网2024-01-19 13:54:580000低价互卷,Temu们成为这届「黑五」赢家?
作为“双十一”前辈的“黑色星期五”,一向是欧美市场一年里最重要的消费时段,而在互联网兴起后,2005年美国创业者又发明出了紧接着“黑五”的“CyberMonday”(网络星期一)这一时间点,几乎可以说是拉开了整个圣诞季购物狂欢的序幕。站长网2023-12-05 18:04:490000反盗版组织下线AI训练数据集 “Books3” Meta大模型也曾使用
本文概要:1.反盗版组织成功要求在线盗版书籍资源库TheEye下线AI训练数据集"Books3"。2."Books3"数据集包含了37GB的文本,用于训练人工智能模型,已被多家公司使用。3.反盗版组织表示AI对版权产生了新的挑战,计划继续打击其他存有该数据集的网站。站长网2023-08-22 12:01:020000日本制定AI准则应对过度依赖AI技术和数据偏见
🔍划重点:1.🌐日本政府制定AI准则,旨在减少过度依赖AI技术,并解决数据偏见问题。2.📜政府将在年底前敲定准则,包括10项基本原则,以确保AI公司遵循公平、透明和人权保护原则。3.🤖AI开发者、服务提供商和用户将共同承担责任,开发者需确保数据准确性和防止未经授权的访问,提供商需警告用户有关个人信息,并保证服务的有限使用。站长网2023-10-24 23:46:570000