21944

华为PixArt-Σ放出模型文件可在Comfyui使用

站长网2024-04-29 19:28:181阅

最近，华为的4K图像模型PixArt-Σ放出了模型文件，而且diffusers也支持了这个架构，用户可以在Comfyui上尝试。

尽管他们XL-1024版本的模型大小只有2G，但在图像表现和提示词理解方面，它与SD3模型相当接近。可以在Comfyui上尝试。

工作流地址:https://civitai.com/models/420163

项目地址:https://github.com/PixArt-alpha/PixArt-sigma

据悉，PixArt-Σ模型采用了先进的弥散Transformer技术，通过弱到强的训练方法，专注于生成4K分辨率的高质量图像。

模型特点:

轻量化设计:PixArt-Σ的XL-1024模型大小仅为2G，相较于其他同类模型，它在保持较小体积的同时，图像表现力和提示词理解能力却毫不逊色。

风格多样性:在一些特定风格的表现上，PixArt-Σ与著名的SD3模型相比也显得颇具竞争力。

Diffusers支持:PixArt-Σ模型支持Diffusers框架，这使得用户可以在Comfyui等平台上尝试使用该模型，并通过使用patches来加速生成过程，提升用户体验。

技术实现:

PixArt-Σ通过弥散Transformer进行训练，该技术允许模型从低分辨率逐渐过渡到高分辨率的图像生成，有效提升了生成图像的细节和质量。

应用场景:

该模型的应用场景广泛，不仅适用于艺术创作和设计领域，还能满足游戏开发和营销等不同行业的需求。PixArt-Σ为用户提供了一种高质量的图像生成工具，能够根据文本提示生成具有特定风格的4K分辨率图像。

华为PixArt放出模型文件可在Comfyui使用

0001

评论列表

共(0)条

相关推荐

站长资讯
微软 Azure 发布能跨多种模态生成内容的 CoDi 模型：同时处理和生成文本、图像、视频和音频
作为人工智能领域的一项显著进步，微软Azure认知服务研究中心和北卡罗来纳大学NLP（自然语言处理）团队的研究人员日前推出了CoDi，这是一种尖端的生成模型，能够跨多个领域无缝生成高质量内容。图片来自Microsoft这一突破性的发展为更全面地理解世界和人类理解提供了新的可能性，为沉浸式人机交互提供了平台，改变了人类与计算机的互动方式。
站长网2023-07-12 11:35:40
0000
站长资讯
2024年胡润百富榜发布：字节跳动张一鸣首次成为中国首富
今日，胡润研究院发布《2024胡润百富榜》，本次共有1，094位个人财富50亿元人民币以上的企业家登上今年胡润百富榜，比去年减少12%（147位）。上榜企业家总财富21万亿元，比去年下降10%(2.4万亿)。千亿级企业家比去年减少4位，至26位。十亿美金企业家比去年减少142位，至753位。
站长网2024-10-29 11:09:49
0000
站长资讯
元象XVERSE多模态数字人上线
元象XVERSE宣布推出多模态数字人，其多模态数字人方案具有以下特点:形象逼真、能听会道、灵活生动和情智兼备。在形象逼真方面，元象通过自研的渲染引擎和制作模块，实现了高品质的皮肤渲染、逼真的头发和眼球效果，以及真实的布料光照。在能听会道方面，元象提供了语音识别、全双工语音交互和语音合成等一站式服务，实现了准确快速的语音识别和自然流畅的语音交互。
站长网2023-11-23 12:05:05
0002
站长资讯
Twitter变成Titter，马斯克为旧金山总部“w”涂上背景色
据外媒报道，马斯克去年在购买之前提议将Twitter的名称更改为Twitter，并为此在社交媒体上发起了一项在线调查。在调查中，他询问人们是否支持从推文名称中删除“w”，并得到超过100，000名用户的热烈响应。马斯克删除w的举动很可能是对他之前提议的回应。
站长网2023-04-12 12:19:30
0000
站长资讯
一次拿下10亿美金融资，杨植麟和月之暗面要放开手脚了
月之暗面，拿到了中国大模型初创公司自ChatGPT出现至今的最大一笔单轮融资，10亿美元。据36氪获悉，这轮新的融资动作在近日完成，投资方包括从天使轮就已进场的红杉中国，以及首次露面的小红书、美团和阿里巴巴。从去年年初攥着5000万美金入局，到去年10月拿到老股东红衫中国领投的近3亿美元的新一轮融资，再到这笔10亿美元融资完成，月之暗面估值已接近25亿美金。
站长网2024-02-20 17:22:19
0000