AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像,网友:我分不清啊
最新AI文生图模型Flux1.1,一夜刷屏。
只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。
评论区网友的反应be like:我分不清,真的分不清啊。
这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。
比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG” 随机编号 “.CR2”,再加指定的内容,就能获得一张写实图像了。
后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。
以至于有人都开始怀疑,不会是模型随机吐出来一张训练数据里的真照片吧?
不过放大看一些特定细节,还是很容易看出确实是AI生成的,比如车牌号上的文字都是乱码。
那么是否Flux1.1模型本身能力就很强大,这个技巧在其中起到了多大作用呢?
一位资深修图师傅晒出了对比,左边加了IMG_1018.CR2,对比右边不加的,他认为差别巨大。
我们的实测结果也能看出,加上这个技巧能显著提升画面真实性。
现在想免费试玩这个Flux1.1模型,可以来到together.ai平台,注册即送5美元的积分。
随便生成一张在长城的游客自拍照,乍一看像那么回事,但仔细观察人物皮肤质感、背景山和植物都有还是有一股AI味。
换成“IMG_0314.cr2: selfie on The Great Wall”,是不是立马就不一样了?
代号蓝莓,最新SOTA文生图模型
随着FLUX1.1的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。
官方不藏了,直接放出数据,在Artificial Analysis image arena上,FLUX1.1[pro]以“blueberry”为代号,超越所有其它模型,获得最高的整体Elo评分。
相比之下,FLUX1.1[pro]价格也更低,速度更快,各项指标超越Midjourney、SD3、Ideogram等。
生成速度上,FLUX1.1[pro]在保持图像质量、指令响应和多样性提升的同时,速度是前代FLUX.1[pro]的6倍。
顺便提一下,现在FLUX.1[pro]也进行了更新,速度是之前的2倍,FLUX1.1[pro]的速度是目前可用的FLUX.1[pro]的3倍。
此外,官方表示即将推出快速高分辨率生成,FLUX1.1[pro]可原生支持的那种,在不牺牲任何指令响应情况下,能生成2k图像。
FLUX1.1[pro]将通过Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。
同时官方还推出了BFL API,可供其他开发者集成到自己的应用程序中,API定价是:
FLUX.1[dev]:每张图2.5美分(约RMB0.18元)
FLUX.1[pro]:每张图5美分(约RMB0.35元)
FLUX1.1[pro]:每张图4美分(约RMB0.28元)
Stable Diffusion原班人马打造
FLUX1.1[pro]的背后是Stable Diffusion原团队,成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。
其实Stable Diffusion最初是一个学术研究项目。
由Björn Ommer教授领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习研究小组成员,以及Runway的研究人员Patrick Esser完成。
研究论文发表七个月后,Stability AI开始介入,提供计算资源,以进一步开发文本到图像生成模型。2022年,上述几位论文作者加入Stability AI。
团队一同创建了Stable Diffusion XL、Stable Video Diffusion等。
ICML2024最佳论文之一、Stable Diffusion3技术论文的Rectified Flow Transformers,还有SDXL-Turbo使用的对抗扩散蒸馏方法(Adversarial Diffusion Distillation),也是这帮子人在研究。
今年三月份这些核心研究团队成员被曝集体辞职。
而后,他们组成了新团队名为Black Forest Labs(黑森林实验室),总部位于德国。
今年8月初刚刚宣布成立,并发布了其初代文生图模型FLUX.1,FLUX.1有三个变体:FLUX.1[pro]、FLUX.1[dev]和 FLUX.1[schnell],平衡了性能和可访问性。
目前黑森林实验室已完成种子轮融资,共融资3100万美元,Andreessen Horowitz领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。
据说他们还已经收到General Catalyst、MätchVC的后续投资。
黑森林实验室和马斯克还有合作,将其图像生成模型引入xAI的Grok助手中。
接下来,团队透露将推出SOTA级文本到视频生成模型。
据说他们正在以10亿美元的估值筹集1亿美元资金,比之前1.5亿美元的估值大幅上涨。
从Pika1.5到Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。
Flux1.1试玩
https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro
为什么生成式 AI 的创始人之一要全身心投入 Web3?
利亚·波洛苏欣(IlliaPolosukhin)是2017年AI领域具有里程碑意义的论文《AttentionisAllyouNeed》的团队成员之一,共同创造了Transformer模型,为ChatGPT等生成式AI系统提供了支持。站长网2023-08-24 23:45:440000iPad Pro全球首发!M4跑分公布:多核成绩突破1.4万
快科技5月9日消息,苹果最新推出的iPadPro全球首发M4芯片,这款设备已经现身Geekbench数据库。相关页面显示,iPadProM4单核成绩3767,多核成绩14677,作为对比,iPadProM2单核成绩在2500左右,多核成绩在1万左右。在跑分上,M4的单核、多核成绩都是M2的1.5倍左右,性能提升明显。站长网2024-05-09 15:34:320000小米IoT生态大会11月16日举行 HyperConnect将面向三方厂商开放
小米公司CEO雷军近日宣布,小米将于11月16日举行IoT生态伙伴大会。此次大会将展示小米在IoT领域的领先技术和服务,包括IoT开发者服务、IoT互联技术等五个分会场。小米集团高级副总裁、手机部总裁曾学忠确认,当天将有重磅信息发布。他表示,小米的HyperConnect自研跨端互联框架将面向三方厂商开放,这将使得更多品类的智能硬件能够接入。站长网2023-11-15 20:52:110000谷歌提出生成式图像动力学:让静态图片动起来
谷歌团队最新提出「生成图像动力学」,这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频,或者用于与图片中的对象进行交互。项目地址:https://generative-dynamics.github.io/#demo站长网2023-09-18 10:30:49000024小时无休上岗,数字人要抢主播饭碗?
陈峰是一家酒旅行业服务商,负责多家大型主题乐园、文旅景区的直播业务。做直播引流获客成本并不低,一个直播团队至少需要四人:主播、运营、助理和场控,每个月8个账号同时开播,就需要32个人,陈峰算了一笔账,仅人员成本一个月最少30万元。最近看到圈内人在讨论数字人直播后,他购买了10个数字人进行测试。目前,单个账号每月GMV最高已经破千万。随即陈峰又下单了50个数字人,做进一步测试。站长网2023-04-24 09:06:320000