Midjourney角色一致功能保姆级实测!真有那么稳定、可控吗?
昨天,Midjourney补上了一块很重要的拼图,那就是上线角色一致功能(--cref)。
一句话来说就是,现在你可以生成一个角色,然后一直使用这个角色,生成Ta不同造型、不同风格、不同场景、不同视角的图片。
这是写实人像的效果:
动漫人物也不在话下:
甚至还支持双人!不过在精细程度上还有待加强。
操作很简单,只需要复制角色图片的链接,并在新的提示词末尾加上“--cref URL(图片链接)”。
你还可以通过“--cw”来调整参照的“强度”,范围从100到0。默认强度为100,系统会参考人物的脸部、发型和衣着。强度为0时,系统会只专注于面部,适用于更换服装、发型或场景等。
值得一提的是,Cref同样适用于Niji模型,并且可以与--serf指令一起使用。
下面,“头号AI玩家”给大家带来一波保姆级的实测,看看一致性效果是不是真的如此稳定、优质、可控。
真人角色的一致性测评
第一步先上传图片获取图片链接(MJ生成的图片可以直接复制链接)。
右键点击复制链接,获得URL,然后在提示词末尾添加--cref URL。
我甚至没有在提示词中提到Taylor Swift的名字,但从生成结果来看,还是抓取了不少原图角色特征的。
然后我改成--cw0,并变换视角为Bird's Eye View(鸟瞰):
霉霉的衣服也从原来的黑色背心裙变成了V领吊带裙。
值得注意的是,--cref后可以添加多个链接,如--cref URL1URL2,类似于多个图像提示,这样生成的图像会与原图更相似和精确。
不过,正如官方所言,这一功能并不是为真人照片设计的,出于肖像权、隐私和伦理问题考虑,在使用该功能处理他人面孔时,应确保获得了适当的许可。
动漫角色一致性测评
再来试试动漫角色。
Nijijourney是Midjourney推出的一款专门针对二次元和动漫风格的微调模型。我先用Nijijourney生成了一组动漫《Eva》中的角色明日香穿着新中式衣服的图片:
选择其中一张复制图片链接,将提示词的背景改为“赛博朋克风的城市建筑”,然后在末尾加上--cerf URL和--cw100,就得到了以下这组图像:
可以看出,新图像基本保持了原图像的发型、衣服特征,但面部有点崩,且整体质感不够精细。
再改成--cw0试试:
与初始图像的面部一致性依然不够高,但生成的一组头像各自倒是很相似。
考虑到有可能是初始图像的五官不够立体,再换一张试试:
然而效果依然不是很理想:
严重怀疑是不是自己打开方式不对……
再拿用MJ模型生成的动漫角色试试:
结果直接二次元爆改写实风:
不过,除了图二有点恐怖外,其余3张倒是继承了原图的白发芭比形象。
值得一提的是,Midjourney网页端的用法略有不同,上传图片的输入框中,有三个图标,分别对应人物参考(--cref)风格参考(--sref)图像提示,按Shift可以切换选择。
角色一致性功能的应用场景
众所周知,无论是电影、动画、漫画还是视频游戏,角色的视觉形象和人设的一致性、连贯性都是至关重要的,是吸引观众或玩家、维持故事吸引力的关键因素。
然而,保持AI生成角色在不同场景、不同时间点的一致性,对于创作者来说一直是一个挑战。
所以这一功能对于AI视频分镜、AI漫画分镜以及游戏动漫IP的一致性管理具有重要意义,同时也为创作者提供了更多的创意空间,使他们能够尝试不同的故事线和场景变化,而不必担心角色形象的一致性问题。
使用Midjourney制作的漫画,来源X@AiartWanko79426
一致性功能还有利于为用户提供更加个性化和定制化的服务,比如定制AI写真、二次元OC(自设)等。
来源X@nickfloats
最近,Midjourney团队透露,他们正在开发模型个性化功能,看来未来定制一个人物模型会变得更容易。
实际上,在Midjourney上线角色一致功能之前,利用Stable Diffusion Controlnet等插件,也可以实现换脸、换衣服等操作,这也是AI模特用到的常规技术方式之一。
此外,Midjourney也可以结合InsightFace插件进行换脸,只需要将InsightFace机器人邀请到Discord服务器中,上传想要换脸的图片,使用InsightFaceSwap功能,选择之前保存的面孔,进行换脸操作。
还有一款叫“InstantID”的AI工具,能够实现人脸融合的高能操作。
比如80%的杨幂 20%的霉霉:
只需要上传一张本人图像,就能获得7种完全不同风格、各种姿势、高保真度的定制图像,造型和衣服都给你整得明明白白。
动漫风格的转绘也不在话下:
但总的来说,相比开源的AI绘图模型,Midjourney角色一致功能的操作门槛显然更低、更方便。
需要注意的是,角色一致性功能可能会涉及到对真人肖像权的侵犯,以及对现有IP角色的模仿和再创作,从而引发版权争议。
Nothing 的下一款手机将全面采用人工智能技术
划重点:-Nothing首席执行官CarlPei表示,智能手机是未来的人工智能设备,人工智能可能改变我们使用手机的方式。-Nothing团队展示了一些演示,其中一个是类似OpenAI的GPT-4o演示,另一个是个性化、动态的主屏幕。-Nothing的目标是通过人工智能技术,将智能手机从应用中心的模式转变为一个可以随时了解用户需求和位置的系统。站长网2024-06-06 20:58:060000共建未成年人“清朗”网络空间承诺书
互联网已经成为未成年人学习、生活、娱乐和社交的重要空间,新冠疫情发生以来,在线教育迅速普及。为响应国家网信办“清朗”未成年人暑期网络环境专项整治行动,营造“清朗”网络空间,为未成年人提供一个绿色、健康、文明、和谐的在线教育和网络生活环境,作为厦门属地网站平台的代表,自愿履行以下承诺:一、净化网络环境,清朗网络空间,持续践行社会主义核心价值观,坚定“四个自信”,持续净化未成年人上网环境。0001智源悟道3.0“Emu”模型开源
智源研究院发布了首个全能多模态预训练模型Emu的开源版本。Emu在多项性能指标上超越了DeepMind的Flamingo模型,具备统一多模态学习框架和视频数据的大量采用的能力。Emu可以完成任意图生文和文生图的多模态任务,包括图像描述、图像问答、视频问答、文图生成、图像融合和多模态对话等。Emu还具有强大的少样本上下文学习能力,可以根据给定任务的几个示例样本进行上下文学习。站长网2023-07-14 16:31:070000苹果为杀入AI领域低调收购,iOS 18要有大动作
苹果一直是人工智能公司的最大买家,甚至超过了微软和谷歌。在AI领域百花齐放的当下,作为全球顶尖的科技公司苹果,似乎掀起的水花不是很大。苹果在AI领域的布局到底是什么,或许苹果CEO蒂姆・库克的一句话可以为我们答疑解惑。此前在2024苹果股东大会上,库克表示,今年将在GenAI领域实现重大进展。此外,苹果宣布放弃10年之久的造车项目之后,一部分造车团队成员也开始转向GenAI。站长网2024-03-17 18:19:260000阿里淘天第一季度收入932.16亿元!88VIP会员突破3500万人
快科技5月14日消息,今晚,阿里巴巴发布2024财年四季度及全年业绩。财报显示,截至2024年3月31日,淘天集团收入同比增长4%至932.16亿元(129.10亿美元),88VIP会员数量突破3500万人。0000