登陆注册
21944

华为PixArt-Σ放出模型文件 可在Comfyui使用

站长网2024-04-29 19:28:181

最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。

尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。可以在Comfyui上尝试。

工作流地址:https://civitai.com/models/420163

项目地址:https://github.com/PixArt-alpha/PixArt-sigma

据悉,PixArt-Σ模型采用了先进的弥散Transformer技术,通过弱到强的训练方法,专注于生成4K分辨率的高质量图像。

模型特点:

轻量化设计:PixArt-Σ的XL-1024模型大小仅为2G,相较于其他同类模型,它在保持较小体积的同时,图像表现力和提示词理解能力却毫不逊色。

风格多样性:在一些特定风格的表现上,PixArt-Σ与著名的SD3模型相比也显得颇具竞争力。

Diffusers支持:PixArt-Σ模型支持Diffusers框架,这使得用户可以在Comfyui等平台上尝试使用该模型,并通过使用patches来加速生成过程,提升用户体验。

技术实现:

PixArt-Σ通过弥散Transformer进行训练,该技术允许模型从低分辨率逐渐过渡到高分辨率的图像生成,有效提升了生成图像的细节和质量。

应用场景:

该模型的应用场景广泛,不仅适用于艺术创作和设计领域,还能满足游戏开发和营销等不同行业的需求。PixArt-Σ为用户提供了一种高质量的图像生成工具,能够根据文本提示生成具有特定风格的4K分辨率图像。

0001
评论列表
共(0)条