Midjourney角色一致功能保姆级实测!真有那么稳定、可控吗?
昨天,Midjourney补上了一块很重要的拼图,那就是上线角色一致功能(--cref)。
一句话来说就是,现在你可以生成一个角色,然后一直使用这个角色,生成Ta不同造型、不同风格、不同场景、不同视角的图片。
这是写实人像的效果:





动漫人物也不在话下:



甚至还支持双人!不过在精细程度上还有待加强。

操作很简单,只需要复制角色图片的链接,并在新的提示词末尾加上“--cref URL(图片链接)”。
你还可以通过“--cw”来调整参照的“强度”,范围从100到0。默认强度为100,系统会参考人物的脸部、发型和衣着。强度为0时,系统会只专注于面部,适用于更换服装、发型或场景等。
值得一提的是,Cref同样适用于Niji模型,并且可以与--serf指令一起使用。
下面,“头号AI玩家”给大家带来一波保姆级的实测,看看一致性效果是不是真的如此稳定、优质、可控。
真人角色的一致性测评
第一步先上传图片获取图片链接(MJ生成的图片可以直接复制链接)。


右键点击复制链接,获得URL,然后在提示词末尾添加--cref URL。

我甚至没有在提示词中提到Taylor Swift的名字,但从生成结果来看,还是抓取了不少原图角色特征的。
然后我改成--cw0,并变换视角为Bird's Eye View(鸟瞰):

霉霉的衣服也从原来的黑色背心裙变成了V领吊带裙。
值得注意的是,--cref后可以添加多个链接,如--cref URL1URL2,类似于多个图像提示,这样生成的图像会与原图更相似和精确。
不过,正如官方所言,这一功能并不是为真人照片设计的,出于肖像权、隐私和伦理问题考虑,在使用该功能处理他人面孔时,应确保获得了适当的许可。
动漫角色一致性测评
再来试试动漫角色。
Nijijourney是Midjourney推出的一款专门针对二次元和动漫风格的微调模型。我先用Nijijourney生成了一组动漫《Eva》中的角色明日香穿着新中式衣服的图片:

选择其中一张复制图片链接,将提示词的背景改为“赛博朋克风的城市建筑”,然后在末尾加上--cerf URL和--cw100,就得到了以下这组图像:

可以看出,新图像基本保持了原图像的发型、衣服特征,但面部有点崩,且整体质感不够精细。
再改成--cw0试试:

与初始图像的面部一致性依然不够高,但生成的一组头像各自倒是很相似。
考虑到有可能是初始图像的五官不够立体,再换一张试试:

然而效果依然不是很理想:

严重怀疑是不是自己打开方式不对……
再拿用MJ模型生成的动漫角色试试:

结果直接二次元爆改写实风:

不过,除了图二有点恐怖外,其余3张倒是继承了原图的白发芭比形象。
值得一提的是,Midjourney网页端的用法略有不同,上传图片的输入框中,有三个图标,分别对应人物参考(--cref)风格参考(--sref)图像提示,按Shift可以切换选择。
角色一致性功能的应用场景
众所周知,无论是电影、动画、漫画还是视频游戏,角色的视觉形象和人设的一致性、连贯性都是至关重要的,是吸引观众或玩家、维持故事吸引力的关键因素。
然而,保持AI生成角色在不同场景、不同时间点的一致性,对于创作者来说一直是一个挑战。
所以这一功能对于AI视频分镜、AI漫画分镜以及游戏动漫IP的一致性管理具有重要意义,同时也为创作者提供了更多的创意空间,使他们能够尝试不同的故事线和场景变化,而不必担心角色形象的一致性问题。

使用Midjourney制作的漫画,来源X@AiartWanko79426
一致性功能还有利于为用户提供更加个性化和定制化的服务,比如定制AI写真、二次元OC(自设)等。

来源X@nickfloats
最近,Midjourney团队透露,他们正在开发模型个性化功能,看来未来定制一个人物模型会变得更容易。

实际上,在Midjourney上线角色一致功能之前,利用Stable Diffusion Controlnet等插件,也可以实现换脸、换衣服等操作,这也是AI模特用到的常规技术方式之一。
此外,Midjourney也可以结合InsightFace插件进行换脸,只需要将InsightFace机器人邀请到Discord服务器中,上传想要换脸的图片,使用InsightFaceSwap功能,选择之前保存的面孔,进行换脸操作。
还有一款叫“InstantID”的AI工具,能够实现人脸融合的高能操作。
比如80%的杨幂 20%的霉霉:


只需要上传一张本人图像,就能获得7种完全不同风格、各种姿势、高保真度的定制图像,造型和衣服都给你整得明明白白。
动漫风格的转绘也不在话下:

但总的来说,相比开源的AI绘图模型,Midjourney角色一致功能的操作门槛显然更低、更方便。
需要注意的是,角色一致性功能可能会涉及到对真人肖像权的侵犯,以及对现有IP角色的模仿和再创作,从而引发版权争议。
小游戏的“三重门”,字节腾讯也难越?
“羊了个羊”没能拯救休闲游戏市场。尽管字节跳动否认旗下休闲游戏平台Ohayoo没有裁员,但实际上休闲游戏退场几乎没有悬念。“自研停了,发行也不大做了”,Ohayoo一位员工告诉Tech星球,抖音超6亿的日活,没能拯救这个看似很容易的业务。0000微软将 Bing AI 集成到 iOS 和 Android 版 SwiftKey 输入法
此前微软在SwiftKey输入法里已经加入了学习使用者语言风格等AI特性,现在微软更将其无处不在的BingAI聊天机器人集成到预测键盘应用程序中。随着BingAI的升级,微软iOS和Android上的SwiftKey用户在更新后,可以通过键盘上方的Bing按钮调出搜索、聊天和语气这三个选项。站长网2023-04-17 10:17:340001EmoPP模型开源:一款基于情感感知的韵律短语生成模型
EmoPP-Demo是一款基于情感感知的韵律短语生成模型,旨在提高端到端文本转语音(TTS)的自然度和可懂度。自然语音中存在着语言和情感韵律。然而,韵律短语的研究主要受到语言学的启发,情感韵律的研究相对较少。EmoPP-Demo通过准确挖掘话语的情感线索并预测适当的短语分隔符,为情感表达提供了新的可能性。地址:https://ai-s2-lab.github.io/EmoPP/站长网2023-09-26 10:10:590000靠小游戏年入20亿,广州还藏着这么一家「隐形大佬」
小游戏近年来一直被视作新的风口。近日微信公开课新发布的数据显示,微信小游戏平台已有接近40万开发者。而在2023年,只有70多个团队旗下小游戏DAU过百万,100多个团队实现季度流水超千万元。成绩瞩目的团队仍然可以说是凤毛麟角。站长网2024-01-24 13:55:130000李开复:中国能做出碾压美国的AI应用!
快科技12月14日消息,零一万物首席执行官,创新工场董事长李开复公开表示,中国能做出碾压美国的AI应用。他提到,AI时代是用人工智能、超级人工智能,比人还聪明的人工智能,赋能每个应用,让每个应用重写一次,而这个革命就在今年和明年开始会爆发,这就是我们面临的最巨大的一个机会。”产品该怎么去创造呢?李开复提到,不要坐等风来,不要坐等别的公司把模型做得便宜,提供给我们用,我们要自己把模型做得便宜。0000