华为PixArt-Σ放出模型文件 可在Comfyui使用
站长网2024-04-29 19:28:180阅
最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。
尽管他们XL-1024版本的模型大小只有2G,但在图像表现和提示词理解方面,它与SD3模型相当接近。可以在Comfyui上尝试。
工作流地址:https://civitai.com/models/420163
项目地址:https://github.com/PixArt-alpha/PixArt-sigma
据悉,PixArt-Σ模型采用了先进的弥散Transformer技术,通过弱到强的训练方法,专注于生成4K分辨率的高质量图像。
模型特点:
轻量化设计:PixArt-Σ的XL-1024模型大小仅为2G,相较于其他同类模型,它在保持较小体积的同时,图像表现力和提示词理解能力却毫不逊色。
风格多样性:在一些特定风格的表现上,PixArt-Σ与著名的SD3模型相比也显得颇具竞争力。
Diffusers支持:PixArt-Σ模型支持Diffusers框架,这使得用户可以在Comfyui等平台上尝试使用该模型,并通过使用patches来加速生成过程,提升用户体验。
技术实现:
PixArt-Σ通过弥散Transformer进行训练,该技术允许模型从低分辨率逐渐过渡到高分辨率的图像生成,有效提升了生成图像的细节和质量。
应用场景:
该模型的应用场景广泛,不仅适用于艺术创作和设计领域,还能满足游戏开发和营销等不同行业的需求。PixArt-Σ为用户提供了一种高质量的图像生成工具,能够根据文本提示生成具有特定风格的4K分辨率图像。
0000
评论列表
共(0)条相关推荐
创业邦推出创投大模型BangChat 并对网站和APP进行全新改版
创业邦通过将专有的数据与人工智能技术深度融合,推出了创投大模型BangChat,并对网站和移动客户端进行全新改版。创业邦的数据智能驱动了创业者在商业计划、市场预测等方面的决策,而BangChat则通过生成式AI工具提供了智能分析和决策能力。站长网2023-08-30 13:56:240000苹果关闭圣地亚哥人工智能团队 121名员工或将失业
根据知情人士透露,苹果公司计划关闭位于圣地亚哥的一个与人工智能业务相关的团队,共计121人,导致许多员工可能面临被解雇的风险。这个名为DataOperationsAnnotations的团队被告知,他们将被迫搬迁到奥斯汀,并与同一团队的德克萨斯州部分合并。站长网2024-01-15 11:42:030001苹果Vision Pro虚拟现实耳机上市数量极其有限 预计很快售罄
根据天风国际证券分析师郭明池的预测,苹果即将推出的VisionPro虚拟现实耳机可能会很难买到。郭明池周四在社交媒体上表示,鉴于苹果只计划生产6万至8万台这款定价3499美元的虚拟现实耳机,加之它将在2月2日发布,他预计这些耳机有可能会很快售罄。0000科学无国界!清华院长建议分享单晶硅研究成果给美日,助科技进步
站长网2023-05-23 13:30:0600059全面取代Llama 2!Baichuan 2自曝史上最全训练细节
在国内,Llama的时代,已经过去了。9月6日,百川智能宣布正式开源Baichuan2系列大模型,包含7B、13B的Base和Chat版本,并提供了Chat版本的4bits量化,均为免费商用。下载链接:https://github.com/baichuan-inc/Baichuan2站长网2023-09-15 16:06:410000