谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大
站长网2023-12-08 11:53:372阅
Google最近发布了一项名为“Generative Powers of Ten”的图像生成功能,这项功能支持对生成的图像进行无限放大。这意味着用户可以将一张人像照片放大到可以看到细胞结构,或者将地球大气层缩放到地面上的物体。
这一目标是通过联合多尺度扩散采样方法实现的。这种方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。而传统的超分辨率方法可能很难在截然不同的比例下创建新的上下文结构,而这项新的方法能够比传统方法实现更深层次的缩放。

论文地址:https://arxiv.org/pdf/2312.02149.pdf
具体实现方法是使用预训练的扩散模型来同时去噪多个不同尺度的场景图像。每个缩放级别的噪声图像以及相应的提示同时输入到相同的预训练扩散模型中,返回对应的清晰图像的估计。然后采用多分辨率混合将这些区域融合成一致的缩放堆栈,并从一致的表示中重新渲染不同的缩放级别。最后,重新渲染的图像被用作DDPM采样步骤中的清晰图像估计。
与其他生成缩放视频的方法相比,这项新方法的观察结果显示,因果生成通常会导致较差的结果,因为先前的生成结果并不总是与后续的缩放级别兼容。而新方法的联合多尺度扩散采样方法则能够产生更深层次的缩放,并保持一致性,是一项重要的突破。
0002
评论列表
共(0)条相关推荐
LLM能否自我评估安全性?RAIN:一种无需微调即可改善AI对齐和安全防御新方法
文章概要:1.大型语言模型(LLM),如GPT-3,通过自我评估和改进方法(RAIN)能够满足人类需求,无需额外数据和微调。2.RAIN方法具备广泛适用性,适用于多种语言生成任务,无需额外模型或数据存储,且无需依赖标记数据或训练。3.RAIN通过自我评估提高LLM的性能,降低对敌对攻击的成功率,为AI生成更协调和安全的响应。站长网2023-09-18 10:53:170000Google 宣布 Bard AI 聊天机器人现可回答有关 YouTube 视频的问题
Google宣布其BardAI聊天机器人现在可以回答与YouTube视频内容相关的具体问题。尽管Bard在去年9月推出YouTube扩展功能时已具备分析YouTube视频的能力,但现在,聊天机器人可以为您提供有关视频内容的具体查询答案。站长网2023-11-23 09:56:340000DeepSeek并非完美,训练过程存在“深度诅咒”
高性能大模型在训练的过程中通常需要数千个GPU,耗费数月甚至更长时间才能完成一次训练。这种巨大的资源投入使得模型的每一层都必须高效训练,才能确保算力资源最大化利用。但大连理工、西湖大学、牛津大学等研究人员对DeepSeek、Qwen、Llama和Mistral研究发现,这些模型的深层在训练过程中表现并不好,甚至可以被完全剪枝而不会影响模型性能。站长网2025-02-12 09:07:460000月薪6万,哪些AI岗位在抢人?
2023年什么话题最热?这段时间职场人讨论最多的话题是什么?毫无疑问是ChatGPT的出现、AI的技术进步。当然,对职场人最有冲击力的字眼是,“AI取代人类”“10亿打工人被革命”……ChatGPT把我们带进了AI2.0时代,AI的确正以一种超乎我们预期的方式,影响着很多行业。由此衍生的两大话题是,哪些人能坐上这趟AI快车?哪些人的工作会被AI“干掉”?站长网2023-06-12 17:18:140000