AI图片编辑神器Anydoor:开启图片编辑的任意门 图片主体随意移动
划重点:
🌐由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,通过一张照片将任何物品传送到另一张图片的世界中。
🚪 AnyDoor为图片编辑开启全新时代,实现零样本对象-场景合成。
🎨 设计师无需为合照缺人而烦恼,AnyDoor让贴图穿进背景图,实现自动摆姿势、站位的「魔法」。
随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。
这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。
这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。
此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。
AnyDoor能实现的效果包括
1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。
比如把这张图里桌面上的位置任意变化:
2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。
如下图,可以将图中两辆车的位置对调:
3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。
比如把下图中所有的宠物狗都放到同一个草地上:
4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服
这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。
项目网址:https://damo-vilab.github.io/AnyDoor-Page/
论文网址:https://arxiv.org/pdf/2307.09481.pdf
行业首家!抖音上线反网暴法律咨询服务
据抖音官方消息,今天,抖音上线了一个新功能——反网暴“法律咨询”。这项功能由抖音与中国法律咨询中心合作推出,目的是为疑似已遭受网暴的用户,免费提供法律咨询服务。用户在抖音APP首页右上角搜索关键词“网暴”“网络暴力”等关键词,点击“维权指引”,即可看到相关内容,也可通过抖音“安全中心”板块逐步进入。此前,平台已上线了一键防暴、一键举报等一系列功能,并主动发起反网暴知识推广和反网暴倡议。站长网2023-12-18 14:41:330000百度副总裁:靠AI赚钱是今年重点
近日,百度集团高级副总裁、移动生态业务群组(MEG)负责人何俊杰公布了2024年第一季度的目标与关键成果(OKR)。其核心目标为:通过引领AI行业的发展,重构具有代表性的应用场景,以实现盈利增长。站长网2024-02-23 16:40:470000国足0-7输给日本比赛直播崩溃 爱奇艺退款了:网友晒图已到账
快科技9月8日消息,今日,有用户晒出的微信支付消息显示,此前观看国足中日世预赛18强赛所购买的爱奇艺体育会员退款已到账。9月5日晚,2026世界杯亚洲区预选赛十八强赛C组首轮比赛开打,中国男足客场0-7不敌日本男足。这场比赛由爱奇艺体育独家直播。爱奇艺体育APP显示,这场比赛为付费赛事,非会员用户需要支付9元开通爱体育会员,或支付18元购买单场比赛。站长网2024-09-10 13:43:28000010天涨粉156万!“王婆说媒”全网爆火!女网红蹭流量翻车?
头戴大红花、一颗媒婆痣,河南开封万岁山武侠城的一位“开封王婆”成了最近的抖音“流量密码”,她主打一个不管高矮胖瘦、贫穷富贵,只要敢上台,就有可能求得姻缘,堪称是活月老。她的节目现场人山人海,女生可以摸腹肌、在线选帅哥、求复合、求复婚、甚至有百万及网红蹭她的热度而被赶下台……只有你想不到,没有现场看不到,王婆的幽默和控场能力更像是一场精彩相声。站长网2024-03-26 11:44:250000华为版ChatGPT“盘古Chat”将于7月7日发布
据钛媒体消息,华为即将推出一款名为“盘古Chat”的多模态千亿级大模型产品,将于今年7月7日举办的华为云开发者大会(HDC.Cloud2023)上展示并进行内测,主要面向ToB/G政企端客户。站长网2023-06-05 23:57:140000