性能秒杀SD3、DALL·E-3,开源文生图模型杀出大黑马
昨天Midjourney刚进行大更新,今天文生图片开源领域就杀出了一匹大黑马—FLUX.1。
根据其测试数据显示,性能大幅度超过了DALL·E-3、Midjourney V6闭源模型,开源SD3系列的Ultra、Medium、Turbo和SDXL被全线秒杀。
并且FLUX.1表示,文生图只是一个开始,未来还会推出文生视频模型想和Sora、Gen-3、Luma等一线产品过过招。
开源地址:https://github.com/black-forest-labs/flux
在线demo:https://replicate.com/black-forest-labs/flux-pro
出道即巅峰专找最硬的打,有点乔峰横扫聚贤庄的意思。原来刚成立的FLUX.1的创始人是老熟人Robin Rombach。
Robin是扩散模型领域的权威之一,其代表作有VQGAN、 Taming Transformers 和Latent Diffusion。
后来,Stability AI收购了Robin的Latent Diffusion模型,并聘请他成为首席科学家,期间他领导了全球著名文生图开源项目Stable Diffusion系列,这也是全球下载最多、使用最广的开源大模型之一。
今年3月末,Stability AI因资金、运营等问题闹“兵变”,联合创始人被罢免,而Robin也选择了离开。
在沉寂了4个月的时间,Robin成立了新的开源大模型平台FLUX.1,并且已经获得了Andreessen Horowitz领投的3100万美元种子轮。估计以后还会获得大金额融资。
FLUX.1的基础架构是基于Vision Transformer,使用了流程匹配训练方法,同时使用了旋转位置嵌入和并行注意层来提高模型的性能和硬件利用效率。
FLUX.1有120亿参数,本次一共发布了三个版本:1)Pro版,通过API使用;2)dev版,这是一个非商用的指导蒸馏模型,继承了Pro版多数性能;3)schnell版,可以商用的开源模型。
虽然FLUX.1有三个版本,但在文本语义还原、图片质量、动作一致性/连贯性、多样性等方面超过了Midjourney v6.0、DALL·E3、SD3-Ultra等主流开闭源模型,整体性能非常强劲。此外,在文本嵌入图片方面也比这些模型表现的更好。
以下是FLUX.1模型生成的图片展示。
在一个凌乱的小卧室的墙上,有一个通往魔幻森林的大门。
一张旧教室里黑板的照片。黑板上用粉笔写着“让我们一起做一些非常漂亮的东西”,词后有一个红色的粉笔心,阳光从窗户照进来。
水下场景中,两只猫头鹰坐在一张精美的餐桌旁,餐桌中央点燃了蜡烛,两只猫头鹰正在一起享用一顿美味的晚餐。左边的猫头鹰穿着燕尾服,右边的猫头鹰穿着漂亮的裙子。
背景中有一艘潜艇驶过,其侧面画着“What a Hoot”字样。桌子下面的图像底部有小水母在游动,电影般美丽的数字艺术品。
两只穿着维多利亚服装的可爱蜘蛛正在举办一个微型茶会,叶子上有一张小桌子和茶壶。
一位女足球运动员,穿着一件阿迪达斯的球衣,周围是其他运动员模糊效果。
一位三十多岁出头的女子在八角形木制舞池中央弹奏手风琴,舞池有一个木制屋顶,周围是成对跳舞的舞者。
一个超级巨大的黑森林蛋糕,大小如一栋建筑,周围环绕着黑森林的树木。
一个穿着红衣斗篷的超人,在浩瀚、多彩的宇宙中飞行。
很多人都非常看好这个新模型。
一次性发布三个模型,确实让人兴奋。
这V1版本刚发布,就已经有人期待V2版本了。
怎么样,FLUX.1生成的图片质量、细节和光影效果还行吧,期待一下他的文生视频模型。
7天涨粉400万,谁制造了“挖呀挖”?
不是每一个爆火的“素人”都能成为“丁真”。最近,很多人不是被“挖呀挖”洗脑,就是在被洗脑的路上。“在小小的花园里面挖呀挖呀挖,种小小的种子,开小小的花。”这两天,一首名为《小小花园》的童谣刷屏网络,简单的旋律配合直白歌词,引发大量网友模仿。一时间,“挖呀挖”相关内容开始从短视频领域蔓延到微信、微博、小红书等平台。站长网2023-05-08 09:25:500000做出了10亿+月流水游戏的厂商,如今照着出海产品的思路做新游?
2023年全球手游市场最引人瞩目的新品爆款,当属美国厂商Scopely旗下的社交博弈游戏「MONOPOLYGO!」。这款得到经典桌游「大富翁(Monopoly)」IP加持的产品,最早在2022年6月上线,2023年4月在美国iOS端正式上线。「MONOPOLYGO!」是2024年5月全球手游月流水Top1,超过「王者荣耀」|图片来源:SensorTower站长网2024-06-29 22:37:110001苹果手机NFC芯片将开放:丰富用户使用场景
苹果公司最近在其官网上宣布,将向开发者开放iPhone的NFC芯片,允许他们在App中使用安全元件进行非接触式数据交换。这项更新意味着开发者可以利用NFC和安全元件(SE)API,在App内实现多种无接触功能,如店内支付、汽车钥匙、公共交通卡、企业工牌、学生证、家庭门钥匙、酒店房卡、商家积分卡和活动门票等。苹果还表示,未来NFC功能将扩展至支持身份证件。站长网2024-08-15 23:30:580000苹果 AI 战略高级副总裁:苹果曾考虑收购微软 Bing 以对抗谷歌
站长之家(ChinaZ.com)10月7日消息:据解密的证词显示,苹果曾考虑通过收购微软的搜索引擎Bing来挑战谷歌的搜索业务,这是一个罕见的对幕后故事的窥视,揭示了在谷歌主导的行业中所发生的情况。站长网2023-10-07 11:56:370000百度萝卜快跑开通武汉天河机场自动驾驶接驳服务
8月25日,百度萝卜快跑宣布开通武汉天河机场的自动驾驶接驳服务,目前已开启用户邀约,受邀用户即日起可率先体验。据悉,这是国内首次实现城市市区到机场之间的自动驾驶出行接驳服务,也是国内自动驾驶运营首次贯通城市道路和高速路线,百度也成为国内首个开通机场自动驾驶接驳服务的企业。站长网2023-08-26 16:12:100000