谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大
站长网2023-12-08 11:53:372阅
Google最近发布了一项名为“Generative Powers of Ten”的图像生成功能,这项功能支持对生成的图像进行无限放大。这意味着用户可以将一张人像照片放大到可以看到细胞结构,或者将地球大气层缩放到地面上的物体。
这一目标是通过联合多尺度扩散采样方法实现的。这种方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。而传统的超分辨率方法可能很难在截然不同的比例下创建新的上下文结构,而这项新的方法能够比传统方法实现更深层次的缩放。

论文地址:https://arxiv.org/pdf/2312.02149.pdf
具体实现方法是使用预训练的扩散模型来同时去噪多个不同尺度的场景图像。每个缩放级别的噪声图像以及相应的提示同时输入到相同的预训练扩散模型中,返回对应的清晰图像的估计。然后采用多分辨率混合将这些区域融合成一致的缩放堆栈,并从一致的表示中重新渲染不同的缩放级别。最后,重新渲染的图像被用作DDPM采样步骤中的清晰图像估计。
与其他生成缩放视频的方法相比,这项新方法的观察结果显示,因果生成通常会导致较差的结果,因为先前的生成结果并不总是与后续的缩放级别兼容。而新方法的联合多尺度扩散采样方法则能够产生更深层次的缩放,并保持一致性,是一项重要的突破。
0002
评论列表
共(0)条相关推荐
奥特曼,10亿美元砸向AI芯片
SamAltman(奥特曼),造芯依旧!据彭博社消息,奥特曼再次为一家人工智能芯片企业筹集数十亿美元。目的是利用这笔资金开发一个“工厂网络”(networkoffactories),用于制造,该网络将延伸到全球,并涉及与未透露名字的“顶级芯片制造商”合作。站长网2024-01-20 12:02:36000010万张门票1分钟内售罄,B站和“二次元们”如何占领了7月? | BW现场
没有什么比漫展对二次元的吸引力更大,如果有,那就是“大型漫展”。7月12日至14日,B站在上海国家会展中心举办了BW2024。站长网2024-07-20 00:50:4100002022年抖音房产内容互动量超过200亿次 高活跃兴趣用户达1.2亿
今日,巨量算数发布《2023抖音房产生态白皮书》。白皮书指出,2022年,抖音房产内容的互动量超过200亿次,包括点赞、评论、转发的互动行为同比2021年都实现了稳定增长,用户对房产内容的需求持续推动着内容生态丰富完善,高活跃兴趣用户体量达到1.2亿。站长网2023-04-16 08:25:560000滴滴:端午节前晚高峰每分钟超10万人同时打车 每秒1700人
2023年端午小长假,出行热度持续高涨。6月21日出行晚高峰时段,滴滴每分钟的打车呼叫量突破了10万单,每秒平均1700人同时叫车。打车量大增的原因为,假期出游和异地欢聚需求旺盛,6月22日端午假期首日,滴滴往返机场、火车站等交通枢纽的打车需求相比节前上涨70%,搭乘滴滴顺风车的订单相比节前翻1倍。站长网2023-06-24 14:17:0600001Password瘫痪了大约一个小时,导致部分用户无法登录
划重点:1.🔒1Password遭遇故障,导致部分用户无法登录,公司正在调查。2.🛠️1Password在确认问题后的一小时内发布了修复补丁。3.🌐故障影响全球用户,尤其是欧洲、美国、加拿大等地,涉及单点登录、跨设备同步以及密码保存等问题。站长网2024-02-06 09:48:360000