谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大
站长网2023-12-08 11:53:372阅
Google最近发布了一项名为“Generative Powers of Ten”的图像生成功能,这项功能支持对生成的图像进行无限放大。这意味着用户可以将一张人像照片放大到可以看到细胞结构,或者将地球大气层缩放到地面上的物体。
这一目标是通过联合多尺度扩散采样方法实现的。这种方法鼓励不同尺度的一致性,同时保持每个单独采样过程的完整性。而传统的超分辨率方法可能很难在截然不同的比例下创建新的上下文结构,而这项新的方法能够比传统方法实现更深层次的缩放。
论文地址:https://arxiv.org/pdf/2312.02149.pdf
具体实现方法是使用预训练的扩散模型来同时去噪多个不同尺度的场景图像。每个缩放级别的噪声图像以及相应的提示同时输入到相同的预训练扩散模型中,返回对应的清晰图像的估计。然后采用多分辨率混合将这些区域融合成一致的缩放堆栈,并从一致的表示中重新渲染不同的缩放级别。最后,重新渲染的图像被用作DDPM采样步骤中的清晰图像估计。
与其他生成缩放视频的方法相比,这项新方法的观察结果显示,因果生成通常会导致较差的结果,因为先前的生成结果并不总是与后续的缩放级别兼容。而新方法的联合多尺度扩散采样方法则能够产生更深层次的缩放,并保持一致性,是一项重要的突破。
0002
评论列表
共(0)条相关推荐
35万亿本地赛道火热:客从快手来,货从美团来
2024本地生活拼什么?答案就藏在新线市场用户的手机里。随着互联网巨头不断入局,普通消费者最直观的感受是,能省钱的平台变多了。美团、抖音、快手、小红书甚至视频号,都在将各种线下消费场景搬到线上——餐饮、酒店、美甲、洗车、门票,平台向用户发放团购券,结合短视频、直播等时髦玩法,给商家带去源源不断的新客流,同时给用户带来实惠。0000Midjourney 正式上线角色人物一致性功能
划重点:1.🎭功能介绍:Midjourney推出“角色参考”功能,适用于MJ6和Niji6型号,可根据角色图片创造一致性内容,专注于形象而非风格。2.🌐使用方法:用户可通过在提示后添加--crefURL,并使用--cw调整参考强度,范围从100到0,可适用于更换服装、发型等不同场景。站长网2024-03-12 12:11:110000OpenAI 发布新的 API 更新:成本显著降低、新的函数调用功能以及 GPT-3.5-turbo-16k 上下文版本
OpenAI在周二宣布了其大型语言模型API(包括GPT-4和gpt-3.5-turbo)的一次重大升级,其中包括新的函数调用功能、显著的成本降低以及gpt-3.5-turbo模型的16,000tokencontextwindow(下文窗口)选项。站长网2023-06-15 03:53:100002最新Claude 200K严重「虚标」?大神壕掷1016美元实测,90K后性能急剧下降
【新智元导读】月初刚测了GPT-4Turbo上下文真实实力的大神GregKamradt又盯上了Anthropic刚更新的Claude2.1。他自己花了1016刀测完之后显示,Claude2.1在上下文长度达到90K后,性能就会出现明显下降。OpenAI正忙着政变的时候,他们在硅谷最大的竞争对手Anthropic,则悄悄地搞了个大新闻——发布了支持200K上下文的Claude2.1。站长网2023-11-24 17:00:220000“薛之谦盗摄”上热搜背后,要注意“反屏摄”而非“反分享”
2月15日下午,薛之谦在微博发布了一段题为“偷看”的《飞驰人生2》观后感,长文内容是一贯的薛之谦式幽默文风,主要讲述他观看《飞驰人生2》的经历。内容本来没啥可说的,但配图却闯了祸——因为文内几张照片明显是影院现场拍摄的正片内容,评论中出现了不少人提醒薛之谦此举不妥,@百老汇电影中心也转发并表示“文明观影,拒绝屏摄”。站长网2024-02-17 10:43:330002