旷视发布HiDiffusion,SD生成速度更快,图片质量更高
站长网2024-04-26 16:17:100阅
最近,旷视发布的HiDiffusion技术,近日引起业界广泛关注。这一新技术只需一行代码,便能显著提升SD(扩散模型)生成图像的分辨率和生成速度,允许图像生成的分辨率高达4096×4096,同时将图像生成速度提高1.5至6倍。值得一提的是,HiDiffusion不仅支持所有SD模型,也兼容SD模型的下游模型,如Playground。
在详细介绍中,我们了解到,当直接使用已训练好的图像扩散模型尝试生成更高分辨率的图像时,常会遇到图像中对象不合理重复的问题,且图像生成时间会大幅增加。研究发现,这种对象重复问题主要由U-Net模型深层中的特征重复导致,而图像生成时间增长则主要是由于U-Net中一个自机制注意力的动画操作所致。
为了解决这些问题,旷视推出了新的高分辨率生成框架——HiDiffusion。该框架包含一个称为认知分辨率U-Net(RAU-Net)的模块,能够动态调整特征图尺寸,有效避免了图像中的对象重复现象。此外,HiDiffusion还采用了一种优化后的窗口注意力机制,称为修改版本升降窗多头自注意力(MSW-MSA),显着减少了计算量。
通过将HiDiffusion应用于各种预训练的扩散模型,不仅可以将图像生成的分辨率提高至4096×4096,而且能将图像生成速度提升1.5至6倍。广泛的实验验证表明,这一方法不仅解决了对象重复和高计算负担的问题,而且在生成高分辨率图像的任务上取得了卓越的效果。
项目页:https://top.aibase.com/tool/hidiffusion
代码:https://github.com/megvii-research/HiDiffusion
0000
评论列表
共(0)条相关推荐
保时捷中国召回2570辆进口Taycan系列汽车
据国家市场监督管理总局消息,日前,保时捷(中国)汽车销售有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回管理条例实施办法》的要求,向国家市场监督管理总局备案了召回计划。从2023年10月16日起,召回生产日期在2022年9月22日至2023年8月3日期间的部分进口Taycan系列汽车,共计2570辆。站长网2023-10-11 17:26:160000一年收入10亿,初中毕业的“参哥”为何能反向收割大厂精英?
“员工闹分手提离职我秒批”、“300封举报信撒满工位”、“公关人春节周末没有假期”,前百度公司副总裁璩静的一系列“霸总”言论,引发大量关注与争议。从5月1日璩静发布第一条抖音视频,6日登上热搜,7日清空账号,再到9日离职,璩静事件在不到一周内潮起潮落,看热闹的人也将眼光延伸到了事件背后的个人IP孵化团队。站长网2024-05-16 09:06:070000OpenAI 正准备进行一轮股份出售 公司估值达到 900 亿美元
站长之家(ChinaZ.com)10月17日消息:OpenAI据报道正准备进行一轮股份出售,公司估值达到900亿美元。这是根据纽约邮报最近的一份报道得出的结论,该报道指出,这笔交易可能取决于中东地区的富裕投资者,因为该地区的冲突仍在继续。一位消息人士告诉纽约邮报,这家人工智能(AI)公司正在讨论帮助员工出售价值数千万美元的私有股票,这笔要约交易预计将于10月21日结束。站长网2023-10-18 21:12:470000抖音上线“抖音好书榜”功能 可依据数据生成图书推荐榜单
4月21日,抖音上线“抖音好书榜”功能,依据平台数据生成图书推荐榜单,发掘用户正在分享的好书。据悉,首期共有《快乐上等》《翦商》等20本书上榜。在平台搜索【抖音好书榜】即可查看完整榜单。进入站内榜单,点击榜单上的书籍图片,还可进入该书的聚合页面,观看相关高赞书评视频,进而更立体地了解这本书。站长网2023-04-23 14:05:210000OpenAI 的领导权争议表明了商业化的危险性
在人工智能(AI)领域,保持与快速发展的行业同步是一项艰巨的任务。上周AI创业公司OpenAI的领导争议成为不容忽视的焦点。该公司的董事会原本罢免了首席执行官兼联合创始人SamAltman,据称是因为他过分重视商业化而忽视了AI的安全性。站长网2023-11-28 17:12:290000