旷视发布HiDiffusion，SD生成速度更快，图片质量更高

站长网2024-04-26 16:17:100阅

最近，旷视发布的HiDiffusion技术，近日引起业界广泛关注。这一新技术只需一行代码，便能显著提升SD（扩散模型）生成图像的分辨率和生成速度，允许图像生成的分辨率高达4096×4096，同时将图像生成速度提高1.5至6倍。值得一提的是，HiDiffusion不仅支持所有SD模型，也兼容SD模型的下游模型，如Playground。

在详细介绍中，我们了解到，当直接使用已训练好的图像扩散模型尝试生成更高分辨率的图像时，常会遇到图像中对象不合理重复的问题，且图像生成时间会大幅增加。研究发现，这种对象重复问题主要由U-Net模型深层中的特征重复导致，而图像生成时间增长则主要是由于U-Net中一个自机制注意力的动画操作所致。

为了解决这些问题，旷视推出了新的高分辨率生成框架——HiDiffusion。该框架包含一个称为认知分辨率U-Net（RAU-Net）的模块，能够动态调整特征图尺寸，有效避免了图像中的对象重复现象。此外，HiDiffusion还采用了一种优化后的窗口注意力机制，称为修改版本升降窗多头自注意力(MSW-MSA)，显着减少了计算量。

通过将HiDiffusion应用于各种预训练的扩散模型，不仅可以将图像生成的分辨率提高至4096×4096，而且能将图像生成速度提升1.5至6倍。广泛的实验验证表明，这一方法不仅解决了对象重复和高计算负担的问题，而且在生成高分辨率图像的任务上取得了卓越的效果。

项目页:https://top.aibase.com/tool/hidiffusion

代码:https://github.com/megvii-research/HiDiffusion

旷视发布HiDiffusionSD生成速度更快图片质量更高

0000

评论列表

共(0)条

相关推荐

北大教授陈钟谈 AI 未来：逼近 AGI、融进元宇宙，开源是重中之重
去年11月底ChatGPT横空出世时，可能谁也没想到，一场规模庞大的变革将由此开启。凭借其强大的语言理解和生成能力，ChatGPT上线2个月突破1亿月活，吸引了工业界和学术界的广泛关注，以ChatGPT为代表的大模型技术更被认为开启了AI2.0时代:▶比尔·盖茨:ChatGPT有着重大的历史意义，不亚于互联网或个人电脑的诞生;
站长网站长资讯2023-05-24 10:10:40
0001
在变化中寻找解法数据安全为数字经济发展保驾护航
来源：人民网原创稿数据是数字经济的核心生产要素，而保护数据安全，是数字经济发展的重点之一。数据的主体是谁？如何从国家、企业层面保护数据安全？如何促进数据有序跨境流动？围绕数据安全这一话题，多位专家学者在博鳌亚洲论坛上展开讨论。
站长网站长资讯2023-05-24 13:06:40
0000
站长资讯
密歇根州议会采用新的 AI 技术来检测枪支
划重点:🔍密歇根州议会将在议会大楼安装新的人工智能技术，用于检测枪支。🔍这项名为ZeroEyes的人工智能技术可以通过分析现有摄像头的监控录像来识别枪支。🔍这项技术的目的是为州议会提供额外的安全保障，一旦有人在摄像头前拿出枪支，警报就会被发送到监控中心。
站长网2023-11-21 09:58:10
0000
请回答｜微信2023：小步快跑，大开大合
十年前，人们常说「BAT之外，再无互联网」，十年后，BAT已经是古典的提法了，但中文互联网的战争却没停下过。字节跳动在进入本地生活，进入同城零售，进入货架电商。小红书成为一个所有玩家都不得不高度重视的竞争对手。拼多多在过去三年那样摧枯拉朽式的份额增长后，仍未停下显著的扩张势能。在2023Q3财报披露后，拼多多股价再次上扬，一度超过阿里，20年电商龙头短时间内易主。
站长网站长资讯2023-12-01 09:13:21
0000
站长资讯
AI虚拟陪伴聊天应用如此火爆，为什么没有中国版Character.ai出现？
三句话，让生气的AI恋人原谅我。最近，一款名为“哄哄模拟器”的AI聊天产品突然走红。与单纯提供陪伴、情绪价值的AI聊天应用不同，哄哄模拟器更像是一个练习高情商对话的小游戏。游戏内预设了多种常见的情侣吵架场景，包括但不限于:你需要想方设法在限定聊天轮次内，哄好自己的AI女友or男友，获得Ta的原谅。是否哄好由“原谅值”来决定，原谅值会随着聊天发生变化。
站长网2024-01-30 11:57:36
0006