华为发布图像生成模型PixArt-\Sigma 可直出4K图像
站长网2024-03-08 15:08:492阅
华为近日发布了一项名为 PixArt-\Sigma 的图像生成模型,该模型采用了 DiT 架构,可以直接生成4K 分辨率的图像。相比于其前身 PixArt-\alpha,PixArt-\Sigma 在图像保真度上有了明显的提升,并改善了与文本提示的一致性。
项目地址:https://top.aibase.com/tool/pixart
PixArt-\Sigma 的一个关键特点是其训练效率。借助 PixArt-\alpha 的基础预训练,它通过整合更高质量的数据,从"较弱"的基线逐步演变为"较强"的模型,这个过程被称为"弱到强训练"。
PixArt-\Sigma 的进步主要体现在两个方面:高质量的训练数据和高效的 Token 压缩。PixArt-\Sigma 结合了更高质量的图像数据,配对更精确和详细的图像标题,同时在 DiT 框架内提出了一个新的注意力模块,可以压缩键(Key)和值(Value),显著提高效率,促进超高分辨率图像的生成。
由于这些改进,PixArt-\Sigma 以较小的模型规模(6亿参数)实现了优于现有文本到图像扩散模型(如 SDXL(26亿参数)和 SD Cascade(51亿参数))的图像质量和用户提示遵从能力。此外,PixArt-\Sigma 能够生成4K 图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。
0002
评论列表
共(0)条相关推荐
Box 通过 Microsoft 365 Copilot 集成扩展 AI 工作
安全云内容管理提供商Box今天继续推进其生成式AI工作,宣布与Microsoft365copilot进行新的集成。新的集成是Box使用genAI帮助企业用户更好地理解Box内容的价值并从中受益的努力的进一步扩展。早在5月份,该公司就宣布了BoxAI计划,该计划将genAI嵌入Box用户体验中,以查询和汇总数据。站长网2023-07-28 15:21:080000一加官宣一加 Ace 3 将于1月4日发布
一加公司今日正式宣布,旗下全新旗舰手机一加Ace3的发布会将于1月4日14:30举行。此次发布会的主题为“以全能姿态,让旗舰体验全面普及”,预示着这款新机将带来前所未有的全方位体验。一加Ace3的外观设计从海报中得以一窥。该款手机将提供金色(鸣沙金)、蓝色(月海蓝)、黑色(星辰黑)三种时尚配色,采用全新玻璃工艺以及旗舰级金属中框,为用户带来高端而优雅的视觉享受。站长网2023-12-27 09:44:410000开源聊天机器人Web UI框架Chatbot UI 可轻松创建任意模型聊天机器人
ChatbotUI是一个开源的聊天机器人WebUI框架,它支持接入多种模型,包括OpenAI、AzureOpenAI、Anthropic、Google、Mistral和Perplexity等。此外,它还支持Ollama上的本地模型接入。这意味着只需输入这些模型的API,就能轻松创建非常美观的任意模型聊天机器人。站长网2024-01-12 11:36:310001AI视野:字节发布视频模型MagicVideo-V2;OpenAI推出自定义GPT商店;Midjourney将上线一致性角色生成功能;Steam允许平台发布AI游戏
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📈💻💡大模型动态字节跳动发布视频生成模型MagicVideo-V2站长网2024-01-11 16:29:390000半年花2万,年轻人“集卡”上头
背后公司暴赚,年入40亿。一代人有一代人的精神食粮。很多80后、90后小时候以收集水浒人物卡为乐,不少00后、10后是奥特曼卡片的狂热爱好者。近年来,谷子经济火爆,卡牌企业开发各种IP,借势又火了一波。如小马宝莉等IP,从小学生席卷到了成年群体。0000