Stability AI 发布最新 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0
人工智能初创公司 Stability AI 在面临日益激烈竞争和道德挑战的情况下,继续改进其生成式 AI 模型。

SDXL 1.0 将在 Amazon Bedrock 上亮相,这是亚马逊 AWS) 提供的完全托管服务,可通过 API 访问领先的 AI 初创公司和 Amazon Titan 的基础模型。该公告是在年度 AWS 纽约峰会上发布的,进一步确认了 Amazon 致力于为客户提供最强大的文本到图像基础模型(例如 Stability AI 的 SDXL 1.0)的承诺。
今天,Stability AI 宣布推出名为 Stable Diffusion XL 1.0 的文本到图像模型,该公司称其为「迄今为止最先进」的版本。Stable Diffusion XL 1.0 可在 GitHub 上开源,并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称,与其前身相比,Stable Diffusion XL 1.0 提供了「更鲜艳」和「更准确」的颜色,以及更好的对比度、阴影和光照。
Stability AI 的应用机器学习负责人 Joe Penna 在接受媒体采访时指出,Stable Diffusion XL 1.0 含有 35 亿个参数,可以在多种宽高比下「几秒钟内」生成完整的 100 万像素分辨率图像。在这种情况下,「参数」是模型从训练数据中学习到的部分,实际上定义了模型在解决问题时的技能,在本例中生成图像。
上一代的 Stable Diffusion 模型 Stable Diffusion XL 0.9 也可以生成更高分辨率的图像,但需要更多的计算能力。
Penna 表示:「Stable Diffusion XL 1.0 是可定制的,可以根据概念和风格进行微调。」他说:「它也更容易使用,可以通过基本的自然语言处理提示实现复杂的设计。」
此外,Stable Diffusion XL 1.0 在文本生成方面也有所改进。虽然许多最佳的文本到图像模型在生成图像上表现不佳,很难生成可辨认的标志、书法或字体,但 Stable Diffusion XL 1.0 可以进行「高级」文本生成和可读性,Penna 表示。
根据 SiliconAngle 和 VentureBeat 的报道,Stable Diffusion XL 1.0 还支持修复(重建图像中缺失的部分)、扩展(延长现有图像)和「图像到图像」的提示——这意味着用户可以输入图像并添加一些文本提示,以创建该图片的更详细变化。此外,该模型可以理解用短提示给出的复杂、多部分的指令,而以前的 Stable Diffusion 模型需要更长的文本提示。
Penna 承认滥用是可能的,他还承认模型也存在一定的偏见。但他补充说,Stability AI 采取了「额外措施」来减少有害内容的生成,通过对模型的训练数据进行「不安全」图像过滤,并发布与问题提示相关的新警告,尽可能地封锁工具中的有问题术语。
Stable Diffusion XL 1.0 的训练集还包括来自抗议企业(包括 Stability AI)使用他们的作品作为生成式 AI 模型训练数据的艺术家的艺术作品。Stability AI 声称,至少在美国,根据公平使用原则,它不承担法律责任。但这并没有阻止一些艺术家和股票照片公司 Getty Images 提起诉讼,以制止这种做法。
Stability AI 与初创公司 Spawning 合作,以尊重这些艺术家的「选择退出」请求。该公司表示,它并没有从训练数据集中删除所有被标记的艺术作品,但「继续纳入艺术家的请求」。
随着 Stability 在商业活动中遇到停滞,面临着 OpenAI、Midjourney 等竞争对手的激烈竞争,该公司正在推动合作伙伴关系和新能力的开发。今年 4 月,Semafor 报道称,Stability AI 迄今已筹集了超过 1 亿美元的风险投资,但该公司正在烧钱,促使其在 6 月关闭 2500 万美元的可转换票据,并寻求帮助增加销售。
Stability AI 首席执行官 Emad Mostaque 在新闻稿中表示:「最新的 SDXL 模型代表了 Stability AI 创新传统的下一步,以及能够为 AI 社区提供最前沿的开放访问模型的能力。」他还说:「在 Amazon Bedrock 上发布 1.0 版本表明我们与 AWS 紧密合作,为开发人员和客户提供最佳解决方案。」
Stable Diffusion XL 1.0 GitHub:
https://github.com/Stability-AI/generative-models
重生:中小商家在小红书新机遇
未做小红书前,我一直做品牌策划相关,从事品牌调研、广告语撰写、项目提案等内容,接触的品牌几乎是区域或行业龙头品牌。当时公司策划项目也是50W起,这都不包括广告费用,久而久之就会产生一种错觉,拿不出50W策划费,还做什么营销!如果你和我有类似的经历,那我们一定看过华与华、叶茂中、科特勒、定位等等书籍。但做小红书营销后,之前理论也逐步失效,因为接触的商家各种各样都有。站长网2023-08-11 11:48:420000郭明錤:2024 年的 iPhone 16 Pro 将获得更大的屏幕和潜望式镜头
明年的iPhone16Pro系列将会配备潜望式镜头,而与之相反,今年的iPhone15系列只有iPhone15ProMax会采用潜望式相机技术,这是据苹果行业分析师郭明錤最新的消息更新。站长网2023-05-17 11:32:320000阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。站长网2024-07-20 03:30:380000发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
【新智元导读】前段时间,微软公布并开源了最新一代大模型WizardLM-2,号称性能堪比GPT-4。不过,还未上线一天,模型权重和公告全被删除了,原因竟是......上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。却没想到发布几小时之后,立马被删除了。站长网2024-04-24 18:10:020001小米Civi 3即将更新小米澎湃OS
小米今日宣布,将在明天发布小米Civi3迪士尼限定版,联名迪士尼人气形象草莓熊。对于本次联名,小米Civi产品经理胡馨心表示,这一次的合作真的非常有趣。此外,胡馨心在回复网友问题时透露,小米Civi3即将更新小米澎湃OS。0000