华为发布图像生成模型PixArt-\Sigma 可直出4K图像
站长网2024-03-08 15:08:492阅
华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha,PixArt-\Sigma 在图像保真度上有了明显的提升,并改善了与文本提示的一致性。

项目地址:https://top.aibase.com/tool/pixart
PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过整合更高质量的数据,从"较弱"的基线逐步演变为"较强"的模型,这个过程被称为"弱到强训练"。
PixArt-\Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的图像数据,配对更精确和详细的图像标题,同时在 DiT 框架内提出了一个新的注意力模块,可以压缩键(Key)和值(Value),显著提高效率,促进超高分辨率图像的生成。
由于这些改进,PixArt-\Sigma 以较小的模型规模(6亿参数)实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。此外,PixArt-\Sigma 能够生成4K 图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。
0002
评论列表
共(0)条相关推荐
Vast Data融资1.18亿美元,拓展人工智能工作负载的数据存储平台
**划重点:**1.💼纽约初创公司VastData完成1.18亿美元的E轮融资,估值91亿美元。2.🚀该公司提供面向人工智能和机器学习工作负载的无结构数据存储解决方案。3.🌏融资将用于扩大业务,重点覆盖亚太、中东和欧洲地区。0001百万粉科普博主GenJi:未来AIGC可能占据90%内容
从AI绘画开始,AIGC逐渐影响到设计、广告、影视等各行各业。GenJi是一名拥有百万粉丝的科普创作者,也是一名AI科技创业者,他从Photoshop、Premiere等教程起步,将账号“GenJi是真想教会你”做到了B站设计教学区综合影响力第一名,之后加入了AI绘画教学内容,出版了《Midjourney创作从入门到应用》等畅销书。站长网2024-02-01 15:36:310000库克:我看好DeepSeek 这种颠覆性的新模式对苹果影响大
科技头条1月31日,苹果发布财报后,库克回应了媒体和分析师对DeepSeek的提问。库克对DeepSeek的评价库克表示,他对DeepSeek这家公司持乐观态度。他认为,DeepSeek的创新模式可以给苹果带来积极的影响。苹果的AI策略库克重申了苹果始终坚持软硬件紧密集成的理念。他指出,苹果的服务大部分在设备端处理,小部分在私有云上处理。从架构角度来看,整个处理逻辑会模拟设备端。0000超过一半的投资者愿意采纳AI提供的投资建议
文章概要:1.超过半数投资者在某些情况下愿意接受人工智能提供的投资建议。2.老年投资者相比年轻投资者更倾向于接受人工智能提供的投资建议。3.只有很小一部分投资者愿意直接执行人工智能提供的建议,大多数投资者仍希望由人类投资顾问过目。最近一项调查显示,超过半数的投资者在某些情况下愿意接受人工智能系统提供的投资建议,只要这些建议能够由金融顾问过目。站长网2023-08-26 16:12:100000vivo发布自研AI蓝心大模型 并宣布开源7B自研大模型
vivo在今天举行的开发者大会上发布了自主研发的AI蓝心大模型,同时还推出了新一代的操作系统OriginOS4。vivo自研的AI蓝心大模型是vivo在AI领域的重要布局之一,该模型具备高效、智能、安全等特性,可以支持多种应用场景。通过自研AI大模型,vivo将能够更好地理解和满足用户需求,提升用户体验。蓝心大模型包含十亿、百亿、千亿三个参数量级共5款,全面覆盖核心场景,模型能力行业领先。站长网2023-11-01 10:32:280001