谷歌推扩散模型变种UFOGen 真正实现一步文生图
站长网2023-11-20 14:54:031阅
要点:
1. 谷歌研究团队提出了一种名为UFOGen的扩散模型变种,只需要一步就能生成高质量的图片。
2. UFOGen通过改变生成器的参数化方式和重构损失函数的计算方式,理论上可以实现一步生成。
3. UFOGen的生成器和判别器都是由Stable Diffusion模型初始化,这样可以最大限度地利用Stable Diffusion的内部信息。
近年来,扩散模型在视觉创作领域的应用不断增加,但是生成速度一直是一个问题。然而,随着技术的进步,UFOGen模型的出现解决了这个问题,它只需要一步就能生成高质量的图片。通过改变生成器的参数化方式和重构损失函数的计算方式,UFOGen实现了一步生成的目标。
论文地址:https://arxiv.org/pdf/2311.09257.pdf
之前对扩散模型生成速度的研究主要集中在两个方向,一方面是利用更少的离散步数求解扩散模型的采样ODE,另一方面是利用知识蒸馏的方法将采样路径压缩到更小的步数。然而,谷歌的研究团队在UFOGen模型中采用了一种全新的思路,通过改变生成器的参数化方式和重构损失函数的计算方式来实现一步生成的目标。
UFOGen模型是在扩散模型和GAN混合模型的基础上发展而来的。扩散模型假设降噪分布是一个简单的高斯分布,但这种假设只在降噪步长趋于0时成立,导致生成速度很慢。而UFOGen模型通过使用带条件的GAN来模拟降噪分布,取较大的降噪步长来减少步数,从而提高了生成速度。
0001
评论列表
共(0)条相关推荐
体育画报出版商发生AI丑闻后解雇CEO
划重点:1.体育画报出版商宣布与CEO罗斯·莱文森(RossLevinsohn)终止其雇佣关系。2.该公司曾出版由不存在的作家署名并标注人工智能生成的个人资料图片遭批判3.公司高级副总裁宣布罗斯·莱文森解约,并有新的临时CEO加入。0000FakeYou:克隆你的声音,生成个性化语音
FakeYou是一款功能强大的文本到语音音频剪辑工具,可以帮助用户生成个性化的语音内容。它简单易用,提供多种语音风格和场景选择,同时支持实时语音克隆和仿声模拟体验。体验地址:https://fakeyou.com/不仅适用于个人使用,还能为内容创作者和任何希望为消息添加个性的人提供帮助。无论是在工作、学习还是娱乐中,FakeYou都能满足用户的需求,让用户更好地表达自己。功能:站长网2023-08-15 11:17:340000美团20.6亿收购光年之外,大模型创业是巨头游戏?8位一线从业者这样说
20.6亿!美团昨日在港交所发布公告,宣布以约20.65亿元人民币的价格,完成对大模型创业公司“光年之外”的股权收购。美团收购光年之外的公告,图源:港交所光年之外由美团联合创始人王慧文创立,是目前国内最受瞩目的大模型创业公司之一。4个月前,已经退休的王慧文发布“AI英雄榜”,自带5000万美元高调入局大模型,打响了国内大模型之战。站长网2023-07-04 11:14:400001微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2
要点:1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。2、Phi-1.5在常识推理任务上表现优异,优于多个参数量十倍以上的模型。3、研究表明,模型参数规模不是决定性因素,高质量数据更为重要。微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。站长网2023-09-18 10:01:440000月入过万只需用ChatGPT建个网站?AI创业博主在线教学
靠着AI创建的网站,就能月入过万?而且……自从网站建好后就再也没碰过?在𝕏上,一名博主小哥分享了自己的“财富密码”。这名小哥叫PaulCouvert,是一名小有名气的AI博主,在𝕏上拥有18.7万粉丝。Paul介绍,自己2022年11月用ChatGPT设计了一个网站,然后就……没有然后了(bushi)。站长网2024-01-21 10:30:400000