首页站长资讯Stability AI 发布最新 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

Stability AI 发布最新 35 亿个参数的图像生成模型 Stable Diffusion XL 1.0

站长网2023-07-27 10:12:250阅

人工智能初创公司 Stability AI 在面临日益激烈竞争和道德挑战的情况下，继续改进其生成式 AI 模型。

SDXL 1.0 将在 Amazon Bedrock 上亮相，这是亚马逊 AWS) 提供的完全托管服务，可通过 API 访问领先的 AI 初创公司和 Amazon Titan 的基础模型。该公告是在年度 AWS 纽约峰会上发布的，进一步确认了 Amazon 致力于为客户提供最强大的文本到图像基础模型（例如 Stability AI 的 SDXL 1.0）的承诺。

今天，Stability AI 宣布推出名为 Stable Diffusion XL 1.0 的文本到图像模型，该公司称其为「迄今为止最先进」的版本。Stable Diffusion XL 1.0 可在 GitHub 上开源，并提供给 Stability 的 API 和消费者应用程序 ClipDrop 和 DreamStudio。Stability 声称，与其前身相比，Stable Diffusion XL 1.0 提供了「更鲜艳」和「更准确」的颜色，以及更好的对比度、阴影和光照。

Stability AI 的应用机器学习负责人 Joe Penna 在接受媒体采访时指出，Stable Diffusion XL 1.0 含有 35 亿个参数，可以在多种宽高比下「几秒钟内」生成完整的 100 万像素分辨率图像。在这种情况下，「参数」是模型从训练数据中学习到的部分，实际上定义了模型在解决问题时的技能，在本例中生成图像。

上一代的 Stable Diffusion 模型 Stable Diffusion XL 0.9 也可以生成更高分辨率的图像，但需要更多的计算能力。

Penna 表示：「Stable Diffusion XL 1.0 是可定制的，可以根据概念和风格进行微调。」他说：「它也更容易使用，可以通过基本的自然语言处理提示实现复杂的设计。」

此外，Stable Diffusion XL 1.0 在文本生成方面也有所改进。虽然许多最佳的文本到图像模型在生成图像上表现不佳，很难生成可辨认的标志、书法或字体，但 Stable Diffusion XL 1.0 可以进行「高级」文本生成和可读性，Penna 表示。

根据 SiliconAngle 和 VentureBeat 的报道，Stable Diffusion XL 1.0 还支持修复（重建图像中缺失的部分）、扩展（延长现有图像）和「图像到图像」的提示——这意味着用户可以输入图像并添加一些文本提示，以创建该图片的更详细变化。此外，该模型可以理解用短提示给出的复杂、多部分的指令，而以前的 Stable Diffusion 模型需要更长的文本提示。

Penna 承认滥用是可能的，他还承认模型也存在一定的偏见。但他补充说，Stability AI 采取了「额外措施」来减少有害内容的生成，通过对模型的训练数据进行「不安全」图像过滤，并发布与问题提示相关的新警告，尽可能地封锁工具中的有问题术语。

Stable Diffusion XL 1.0 的训练集还包括来自抗议企业（包括 Stability AI）使用他们的作品作为生成式 AI 模型训练数据的艺术家的艺术作品。Stability AI 声称，至少在美国，根据公平使用原则，它不承担法律责任。但这并没有阻止一些艺术家和股票照片公司 Getty Images 提起诉讼，以制止这种做法。

Stability AI 与初创公司 Spawning 合作，以尊重这些艺术家的「选择退出」请求。该公司表示，它并没有从训练数据集中删除所有被标记的艺术作品，但「继续纳入艺术家的请求」。

随着 Stability 在商业活动中遇到停滞，面临着 OpenAI、Midjourney 等竞争对手的激烈竞争，该公司正在推动合作伙伴关系和新能力的开发。今年 4 月，Semafor 报道称，Stability AI 迄今已筹集了超过 1 亿美元的风险投资，但该公司正在烧钱，促使其在 6 月关闭 2500 万美元的可转换票据，并寻求帮助增加销售。

Stability AI 首席执行官 Emad Mostaque 在新闻稿中表示：「最新的 SDXL 模型代表了 Stability AI 创新传统的下一步，以及能够为 AI 社区提供最前沿的开放访问模型的能力。」他还说：「在 Amazon Bedrock 上发布 1.0 版本表明我们与 AWS 紧密合作，为开发人员和客户提供最佳解决方案。」

Stable Diffusion XL 1.0 GitHub：

https://github.com/Stability-AI/generative-models

0000

评论列表

共(0)条

相关推荐

站长资讯
重生：中小商家在小红书新机遇
未做小红书前，我一直做品牌策划相关，从事品牌调研、广告语撰写、项目提案等内容，接触的品牌几乎是区域或行业龙头品牌。当时公司策划项目也是50W起，这都不包括广告费用，久而久之就会产生一种错觉，拿不出50W策划费，还做什么营销!如果你和我有类似的经历，那我们一定看过华与华、叶茂中、科特勒、定位等等书籍。但做小红书营销后，之前理论也逐步失效，因为接触的商家各种各样都有。
站长网2023-08-11 11:48:42
0000
站长资讯
郭明錤：2024 年的 iPhone 16 Pro 将获得更大的屏幕和潜望式镜头
明年的iPhone16Pro系列将会配备潜望式镜头，而与之相反，今年的iPhone15系列只有iPhone15ProMax会采用潜望式相机技术，这是据苹果行业分析师郭明錤最新的消息更新。
站长网2023-05-17 11:32:32
0000
站长资讯
阿里云全面升级GPU云服务：AI大模型推理性能可提升100%
快科技7月19日消息，阿里云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。
站长网2024-07-20 03:30:38
0000
站长资讯
发布几小时，微软秒删媲美GPT-4开源大模型！竟因忘记投毒测试
【新智元导读】前段时间，微软公布并开源了最新一代大模型WizardLM-2，号称性能堪比GPT-4。不过，还未上线一天，模型权重和公告全被删除了，原因竟是......上周，微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。却没想到发布几小时之后，立马被删除了。
站长网2024-04-24 18:10:02
0001
小米Civi 3即将更新小米澎湃OS
小米今日宣布，将在明天发布小米Civi3迪士尼限定版，联名迪士尼人气形象草莓熊。对于本次联名，小米Civi产品经理胡馨心表示，这一次的合作真的非常有趣。此外，胡馨心在回复网友问题时透露，小米Civi3即将更新小米澎湃OS。
站长网站长资讯2023-12-20 16:18:23
0000