文生图赛道又出黑马,爆火的Flux真能拳打Midjourney吗?(附对比实测)
AI又一次击穿了现实,这次的主角是文生图赛道的黑马:FLUX
FLUX官网:https://blackforestlabs.ai/
先来看看最近在X上爆火的两个帖子:
乍一看还以为是什么大会颁奖典礼和TED Talk的现场,但事实上,这些都是FLUX生成的人物图片,用Runway Gen-3、Kling AI、Luma Dream Machine等“图生视频”的产物。
视频中人物的五官、皮肤的质感和光泽感、握着话筒的手、讲话时的手势和口型,不仔细看几乎看不出任何破绽,就连嘉宾证上的Google字样、背景板上的英文字母都清晰可辨。
不少网友把这种“真实”定义为“Flux realism(Flux现实主义)”。
还有专门的FLUX现实主义风格Lora:
https://replicate.com/fofr/flux-dev-realism
当看到AI生成的极为逼真的人物照片手掌上写着“I am not real”,属实被秀到了。
Flux AI图像正处在与现实无法区分的边缘,这些图像无疑是我见过的最逼真的AI图像。
这不是妥妥的户外运动产品的广告代言人吗?
于是有网友感慨:“这下模特们真要失业了。”
还有网友表示:我们正在进入一个不需要跟KOL付费合作的时代,品牌只需要用AI生成与他们的美学相匹配的influencer就行了。
看了这么多惊艳的效果图,这个横空出世的FLUX到底是什么来头?
原来,FLUX背后的AI初创公司黑森林实验室(Black Forest Labs),聚集了一群从Stable Diffusion出走的核心开发成员。这样看来,仅成立一年多就搞出这么大动静也就不足为奇了。
自8月初发布以来,FLUX可以说是已经被网友们玩出花了。
1. FLUX 图生视频
其中最流行的玩法当然还是用FLUX生图,然后用Runway Gen-3、Kling AI、Luma Dream Machine等AI视频工具转成视频。
举牌求关注视频、自拍视角的Vlog、对镜拍视频、品牌高级感广告大片统统手到擒来。
这光影、这构图,还有模特的妆容和表现力,高级感拉满:
再加上配乐,充满异域风情的服饰、人物脸上热情洋溢的笑容,妥妥的文旅宣传片:
还有网友给视频进行了口型同步,这下AI YouTuber的春天怕不是要来了:
2. FLUX 局部重绘
还有人把FLUX和局部重绘相结合,只见他用笔刷选中怀里的金毛,然后输入提示词“小狮子”,金毛立马摇身一变成了小狮子,而且融合度非常高,手部细节也没有出错。
这小狮子一抱,连带着这个哥们的气质都变了,瞬间有一种迪拜富豪即视感。
感兴趣的玩家可以在HuggingFace上在线体验:
https://huggingface.co/spaces/SkalskiP/FLUX.1-inpaint
3. FLUX Magnific AI
X网友“Javi Lopez”用AI图像增强软件Magnific对FLUX生成的图片进行了高清和放大处理,照片的真实感瞬间next level。
比如这张王室合照,在经过Magnific优化后,无论是皮肤纹理,还是发丝和光影效果都可谓与真人无异,人物神情也更为细腻。
当然,不止人像,插画、风景、食物、建筑等都可以用Magnific增强。
不过,Magnific AI现在开始收费了,而且还不便宜,每月39美元至299美元不等,不支持退款。
FLUX.1模型拥有12B参数,是目前已知最大的文生图模型,包含3个版本:
FLUX.1Pro:闭源模型,仅支持API调用,具备最佳性能,包括最先进的提示跟随能力、视觉质量、图像细节和输出多样性。可以注册官方API申请访问权限,同时支持企业定制 。
FLUX.1Dev:开源模型,不可商用,直接从FLUX.1pro蒸馏而来,具备相似的图像质量和提示词遵循能力,但更高效。
FLUX.1Schnell:开源模型,可商用,专门为本地开发和个人使用量身定制,生成速度最快,内存占用也最小 。
“AI新榜”本想下载安装到本地使用,无奈FLUX对电脑显存配置要求太高。
不过,得益于Flux模型的出色表现和开源优势,有很多平台和开发者已经完成了模型的部署,比如Fal.ai、Replicate、TensorArt、Krea.ai都已支持调用Flux模型,无需下载和部署。
另外,在国内的文生图社区和工具平台LibLib AI上,点击左侧边栏的“高级版生图”,也可以在线体验FLUX的Pro和Dev模型。
阿里也推出了FLUX的中文优化版,开发者可以在百炼大模型服务平台体验或调用FLUX模型。
值得一提的是,Black Forest Labs还表示正在开发新的生成式AI视频模型,为视频创作者提供更多的创意可能性。
我们用几组相同的提示词对FLUX和Midjourney进行了对比实测。
总的来说,FLUX基本可以和Midjourney(下文简称MJ)平起平坐了,甚至在一些方面超越了MJ,毕竟Flux开源。
具体而言,在文本内容的精确度、对提示词的理解上,FLUX略强于MJ。但在美学程度和风格多样性(尤其是艺术家风格)上,FLUX比MJ稍逊色些。
放上提示词和对比图,大家可以自行感受一下两者的差别(左Flux 右MJ):
Create an image of a man wearing a sharp, well-fitted suit, but instead of a regular head, he has a bright yellow balloon for a head. He is riding a bicycle through a serene urban park. The suit should be classic black with a crisp white shirt and a neatly tied tie, fitting him perfectly. The yellow balloon head should be shiny and slightly reflective, with a string tied around his neck like a bowtie. The bicycle should be a classic vintage style, adding a touch of whimsy to the scene. The park in the background should have lush green trees, a smoothly paved path, and a few park benches, creating a calm and pleasant atmosphere. The lighting should be soft and natural, as if it’s a sunny day.
左Flux 右MJ
A man with a head styled as a vintage TV set designed as a fish tank, water and fish inside the TV screen. He is sitting by the window on a vintage chair. The room is filled with retro furnishings, including antique furniture, old lamps, and vintage decorations. Realistic, detailed, cozy atmosphere,4K resolution
左Flux 右MJ
A charismatic speaker is captured mid-speech. He has short, tousled brown hair that's slightly messy on top. He has a round circle face, clean shaven, adorned with rounded rectangular-framed glasses with dark rims, is animated as he gestures with his left hand. He is holding a black microphone in his right hand, speaking passionately. The man is wearing a light grey sweater over a white t-shirt. He's also wearing a simple black lanyard hanging around his neck. The lanyard badge has the text "Flux". Behind him, there is a blurred background with a white banner containing logos and text (including Flux), a professional conference setting
左Flux 右MJ
Create an image of a cat in the style of a Vincent van Gogh painting. The cat should have expressive, swirling fur patterns in vibrant colors, reminiscent of van Gogh's famous brush strokes. Use bold and dynamic lines to depict the fur's texture and movement. The background should be equally rich in color and texture, with a night sky filled with swirling stars, similar to van Gogh's "Starry Night." The overall mood should be both whimsical and intense, capturing the unique essence of van Gogh's artistic style.
左Flux 右MJ
surrealist glitchy off-angle photography, a business man dressed in suit is waking up in a swamp after a party, bottles of wine and cigarettes, foggy atmosphere, in the style of H.P Lovecraft and Katsuhiro Otomo, incredibly detailed, cinematic shot, sharpen, hyper details, professional lighting, pale gradient colour palette
左Flux 右MJ
Createanimageofadark,eerieforestwithtowering,shadowytreesandthickunderbrush.Inthemidstoftheforest,depictasingle,brightstarshiningbrilliantlyinthesky,castingagentle,ethereallightdownthroughthecanopy.
上Flux 下MJ
像FLUX这样的模型所生成的逼真图像,确实引发了关于后真相时代(Post-Truth Era)的担忧。
无论如何,Flux.1的发布与开源对于推动文生图技术创新、提升模型质量、增加行业透明度、促进AI技术的普及与应用都意义重大。
正如Black Forest Labs在成立声明中说的那样:“透明度是建立信任和广泛采用的关键”,“我们相信生成式AI将成为所有未来技术的基础构建块。通过向广泛的受众提供我们的模型,我们希望将其好处带给每个人,教育公众,并增强对这些模型安全性的信任”。
颠覆传统认知!科学家提出对银河系旋臂形态的新认识
近期,中国科学院紫金山天文台徐烨研究团队与中国科学院国家天文台合作提出对银河系旋臂形态的新认识:银河系更像是一个普通多旋臂星系,由内部对称两旋臂和外部多条不规则旋臂组成,而非之前被广泛接受的四条旋臂均从内到外的特殊形态。该研究结果改变了人们对银河系旋臂结构的传统认识。图1:重新绘制的银河系旋臂结构鸟瞰图。其中彩色线条表示脉泽示踪的旋臂,黑色线条表示年轻恒星和疏散星团示踪的太阳附近的旋臂段。站长网2023-05-24 05:35:580000一小时 12 元,我在北欧监狱里训练 AI
芬兰工资水平普遍较高,并且很少有人从事互联网行业。外媒wired实地走访发现,一家名为Metroc的大模型创业公司发现了一种新型劳动力——囚犯。芬兰囚犯的新工作:帮创业公司训练大模型在一个没有窗户的房间里,隔着一张消过毒的白色桌子,我被介绍给了一位四十多岁的女性,她有着方形下巴,用一个淡蓝色的发带把金色的头发扎成了马尾。她说:“大家都叫我果酱”,让我也这么称呼她。站长网2023-10-03 09:49:180000抖音打击网络水军 封禁超3000个恶意举报账号
抖音发布关于打击网络水军的治理公告称,春节期间,抖音平台在日常安全巡检中发现某些营销账号多次举报他人、且举报理由高度相似,部分用户也反馈自己在发布一些与他人观点不同的内容后,被人用“举报封号”威胁。站长网2024-03-15 15:19:280000Sora对国内大厂是机会还是挑战?
抛开技术路线不谈,单就实现效果而言,国内大模型企业们在生成视频方面,是否有着同样的“飞升机会”?龙年的第一个月,正如去年的ChatGPT,OpenAI开年再出一王炸——文生视频领域的Sora。站长网2024-02-26 10:09:190000PyTorch团队推出轻量级runtime
要点:PyTorch团队推出轻量级运行时,支持在边缘设备上运行PyTorchLite运行时具有轻量级、高效、低延迟等特点PyTorchLite还支持对TensorFlow、Caffe2等其他平台的模型进行转换站长网2023-10-19 18:08:130000