ControlNet大更新:仅靠提示词就能精准P图,保持画风不变,网友:效果堪比定制大模型
Stable Diffusion插件、“AI绘画细节控制大师”ControlNet迎来重磅更新:
只需使用文本提示词,就能在保持图像主体特征的前提下,任意修改图像细节。
比如给美女从头发到衣服都换身造型,表情更亲和一点:
抑或是让模特从甜美邻家女孩切换到高冷御姐,身体和头部的朝向、背景都换个花样儿:
——不管细节怎么修改,原图的“灵魂”都还在。
除了这种风格,动漫类型的它也能驾驭得恰到好处:
来自推特的AI设计博主@sundyme就称:
效果比想象得要好!
只需要一张参考图就能完成以上转变,部分图片几乎可以达到定制大模型的效果了。
咳咳,各位AI绘画圈的朋友们,打起精神来,又有好玩的了。
(ps. 第一三张效果图来自油管博主@Olivio Sarikas,第二张来自推特博主@sundyme)
ControlNet上新:保留原图画风的修图功能
以上更新内容,其实指的是一个叫做“reference-only”的预处理器。
它不需要任何控制模型,直接使用参考图片就能引导扩散。
作者介绍,这个功能其实类似于“inpaint”功能,但不会让图像崩坏。
(Inpaint是Stable Diffusion web UI中的一个局部重绘功能,可以将不满意、也就是被手工遮罩的地方进行重新绘制。)
一些资深玩家可能都知道一个trick,就是用inpaint来进行图像扩散。
比如你有一张512x512的狗的图像,然后想用同一只狗生成另一张512x512的图像。
这时你就可以将512x512的狗图像和512x512的空白图像连接到一张1024x512的图像中,然后使用inpaint功能,mask掉空白的512x512部分,漫射出具有相似外观的狗的形象。
在这个过程中,由于图像只是简单粗暴的进行拼接,加上还会出现失真现象,所以效果一般都不尽如人意。
有了“reference-only”就不一样了:
它可以将SD(即“Stable Diffusion”)的注意力层直接链接到任何独立的图像,方便SD直接读取这些图像作为参考。
也就是说,现在你想要在保持原图风格的前提下进行修改,使用提示词直接在原图上就能操作。
如官方示例图将一只静立的小狗改成奔跑动作:
你只需要将你的ControlNet升级到1.1.153版本以上,然后选择“reference-only”作为预处理器,上传狗的图片,输入提示词“a dog running on grassland, best quality……”,SD就只会用你的这张图作为参考进行修改了。
网友:ControlNet迄今最好的一个功能
“reference-only”功能一出,有不少网友就上手体验了。
有人称这是ControlNet迄今为止最棒的一个功能:
传一张带有人物姿势的动漫图片,再写一句看上去跟原图完全无关的提示。突然之间,你想要的效果就在原图的基础上跑出来了。真的很强,甚至说是达到了改变游戏规则的程度。
还有人称:
是时候把以前丢弃的废图都捡回来重新修复一下了。
当然,认为它也不是那么完美也有(比如开头第一张效果图里美女的耳环不对,二张图里头发也都是残缺的),但网友还是表示“总归方向是对了”。
有没有戳中你的心巴?
参考链接:
[1]https://github.com/Mikubill/sd-webui-controlnet/discussions/1236
[2]https://twitter.com/sundyme/status/1657605321052012545
[3]https://twitter.com/uoyuki667/status/1657748719155167233
[4]https://twitter.com/br_d/status/1657926233068556289
[5]https://twitter.com/aiilustnews/status/1657941855773003776
—完—
腾讯QQ黄脸表情全面升级 同时上线9个新表情
腾讯QQ宣布上线了9个新的黄脸表情,包括木鱼、坚强、贴贴等。此外,所有表情在细节和动画效果方面进行了升级,使表情更加立体、出彩。部分表情的情绪表达被放大,增加了眼镜、茶杯等物体的细节。动画效果的帧率也提升到24帧/s,使动作流畅度和情绪表达度更好。目前,用户们可以在最新版本的QQ中体验这些新表情。站长网2023-11-10 12:09:060005大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!
【新智元导读】最近,大模型训练遭恶意攻击事件已经刷屏了。就在刚刚,Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力,他们发现:模型遇到危险任务时会隐藏真实能力,还会在代码库中巧妙地插入bug,躲过LLM和人类「检查官」的追踪!就在昨天,某大厂模型训练遭入侵的事件,惊动了整个AI圈。上图已针对敏感信息进行编辑据悉,疑似有人对某大厂的集群代码持续发起恶意攻击,包括但不限于:0000实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万
生成式模型进入「实时」时代?文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致我们要等一段时间才能拿到生成结果。但最近,一种名叫「LCM」的模型改变了这种情况,它甚至能做到实时的连续生图。图源:https://twitter.com/javilopen/status/1724398666889224590站长网2023-11-15 21:18:160001半佛仙人:在不确定性的世界里,做个目光短浅、思维简单的人
自2019年以公众号黑马姿态闯入大众视野后,“半佛仙人”凭借通俗的语言拆解复杂的商业世界,用犀利的观点搭配魔性表情包,无论文字还是视频爆款不断,全网圈粉超过千万,连续三年获得B站百大UP主,也实现了内容、流量和商业化的高度自洽。站长网2023-04-14 14:11:370000马斯克旗下脑机公司Neuralin启动首次人体试验 招募四肢瘫痪和ALS患者
据彭博社报道,亿万富翁伊隆·马斯克领导的大脑植入创业公司神经链接(Neuralink),正在招募四肢瘫痪和肌萎缩性脊髓侧索硬化(ALS)患者,参与该公司的首次人体临床试验。这标志着这项仿佛科幻的技术更进一步地接近人体应用现实。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-09-20 09:43:320000