Stability AI发布SD3技术报告 披露SD3更多细节
Stability AI 最近发布了他们最强的图片生成模型 Stable Diffusion3(SD3) 的技术报告,披露了 SD3的更多细节。据 Stability AI 所说,SD3在排版质量、美学质量和提示词理解上超过了目前所有的开源模型和商业模型,是目前最强的图片生成模型。

技术报告要点如下:
根据人类偏好评估,SD3在排版质量和对提示的理解程度上,均优于目前最先进的文本生成图像系统,例如 DALL·E3、Midjourney v6和 Ideogram v1。
报告提出了新的多模态扩散 Transformer (Multimodal Diffusion Transformer, 简称 MMDiT) 架构,其使用独立的权重集分别表示图像和语言。与 SD3的先前版本相比,该架构改善了系统对文本的理解能力和拼写能力。
SD38B 大小的模型可以在 GTX409024G 显存上运行。此外,SD3将发布多个参数规模不等的模型方便在消费级硬件上运行,参数规模从800M 到8B。
SD3架构以 Diffusion Transformer (简称"DiT",参见 Peebles & Xie,2023)为基础。鉴于文本嵌入和图像嵌入在概念上存在较大差异,他们为这两种模态使用了独立的权重集。通过这种方法,信息得以在图像 Token 和文本 Token 之间流动,从而提高了模型生成结果的整体理解力和排版质量。
SD3采用了矫正流 (Rectified Flow, 简称 RF) 的公式,在训练过程中,数据和噪声被连接在一条线性轨迹上。这导致了更直的推理路径,从而可以使用更少的步骤进行采样。
他们还进行了扩展矫正流 Transformer 模型的研究,使用重新加权的 RF 公式和 MMDiT 主干网络,训练了一系列模型,其规模从15个 Transformer 块 (4.5亿参数) 到38个块 (80亿参数) 不等。
SD3还引入了灵活的文本编码器,通过在推理阶段移除内存密集型的 T5文本编码器(参数量高达47亿),SD3的内存占用可以大幅降低,而性能损失却很小。
总的来说,Stability AI 的这一技术报告揭示了 SD3的强大功能和细节,显示出其在图片生成领域的领先地位。
详细内容点此查看:https://stability.ai/news/stable-diffusion-3-research-paper
瑞银预计:2022年至2027年间AI需求复合年增长率为61%
瑞士银行巨头瑞银集团的金融服务部门预测,从2022年到2027年,人工智能终端需求将以61%的复合年增长率增长,高于之前的预测。报告认为人工智能领域具有巨大的财务潜力,并指出全球科技总市值已同比增长6万亿美元,其中人工智能相关企业贡献了2万亿美元。站长网2023-07-26 11:37:210000外媒抢先实测Sora,视频大翻车惨不忍睹?不懂物理/动物变形/速度巨慢,但初创公司已经创死一片
【新智元导读】Sora颠覆影视业,现在来看还远。Bloomberg记者亲自试用后发现,Sora生成的视频还是翻车严重。而且,它的速度太太太太慢了!不过尽管如此,OpenAI已经创死了一片初创公司。虽然功能还未正式开放,但已经有外媒抢先上手体验了!结果就是——Sora翻车了!最近,就在外界对Sora一片赞誉声之时,一些冷静的外媒,也开始发出了质疑的声音。站长网2024-02-28 18:14:110002IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型
划重点:🔍IBM发布了一套名为"GraniteCode"的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。🔍GraniteCode模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。站长网2024-05-13 09:45:070000董宇辉称非常多3C厂家愿提供低价 与辉同行首次开启小家电专场
站长之家(ChinaZ.com)2月26日消息:2月25日,与辉同行直播间迎来了重大的产品线调整,首次尝试小家电专场直播。董宇辉在直播过程中透露,众多电子、家居、化妆品等类目的厂家纷纷表示愿意与与辉同行直播间建立更紧密的合作关系,提供更具竞争力的低价以及丰富的配套赠品等机制。他强调,之前之所以没有过多提及这些合作细节,是因为团队不希望过度刺激消费者的购买欲望,倡导理性消费。站长网2024-02-26 15:18:500000AMD 称人工智能是其头号战略重点 今年晚些时候 Instinct MI300 将引领潮流
AMD公司的首席执行官苏姿丰博士在最近的财报电话会议上指出,AMD把未来的发展寄托在人工智能上,InstinctMI300将领跑。站长网2023-05-05 20:37:430000