何恺明与MIT合作推出自条件图像生成框架RCG

站长网2023-12-08 17:09:180阅

要点:

何恺明与MIT合作推出的新自条件图像生成框架RCG在ImageNet-1K数据集上取得了无条件图像生成的新SOTA成绩，无需人类注释，保真且多样。

RCG框架基于类似自监督学习的自条件生成方法，利用表示扩散模型RDM生成低维自监督图像表示，通过SSL图像编码器和MAGE像素生成器实现图像生成。

RCG在ImageNet256×256上实现了3.56的FID和186.9的IS得分。

近期，何恺明与MIT合作推出的自条件图像生成框架RCG在学术圈引起关注。这一框架成功填补了长期存在的有条件和无条件生成任务性能差距，取得了ImageNet-1K数据集上无条件图像生成的新SOTA成绩。

RCG的设计灵感来源于自监督学习，通过表示扩散模型RDM生成低维自监督图像表示。这一表示条件图像生成架构包括SSL图像编码器、RDM和MAGE像素生成器，结构简单而高效。

论文地址:https://arxiv.org/pdf/2312.03701.pdf

为了实现无条件图像生成，RCG的关键在于将图像分布转换为紧凑的表示分布，通过SSL图像编码器实现。RDM模型用于对表示分布进行建模和采样，具有多样性强、计算开销小的优点。最后，MAGE像素生成器根据表示来处理图像像，通过向token化的图像中添加随机掩码并要求网络以条件重建丢失的token，实现图像生成。

RCG在ImageNet256×256上的表现令人瞩目，取得了3.56的FID和186.9的IS得分，相较于之前最先进的无条件生成方法有着显著提升。不仅如此，RCG在无分类器引导的情况下，成绩还能进一步提高到3.31（FID）和253.4(IS)。这一成果展示了自条件图像生成模型的潜力，为图像生成领域带来了新的可能性。

总的来说，何恺明与MIT的合作研究为无条件图像生成领域带来了新的突破，RCG框架的成功应用表明自条件图像生成模型具有巨大的潜力，可能预示着这一领域新时代的到来。

何恺明与MIT合作推出自条件图像生成框架RCG

0000

评论列表

共(0)条

相关推荐

站长资讯
Google DeepMind：通过深度学习发现了220万种新材料
要点:GoogleDeepMind通过GNoME框架成功发现了超过220万种新材料，为人类技术可行材料的数量大幅增加。GNoME框架采用图神经网络和主动学习方法相结合，通过对材料的晶体结构建模，成功预测了材料的形成能量，实现了高效的计算材料发现。通过GNoME，研究人员不仅发现了大量新材料，还展示了机器学习在材料科学中的潜力，为未来的技术创新和解决能源存储等领域的重大挑战提供了可能性。
站长网2023-11-30 10:33:28
0000
独家：一家超级快消品牌的私域新策略
今天要分享的案例来自一家旗下业态极复杂，具备多品类，跨行业，跨不同消费群体的超大集团。一个庞大业态如何做全域/私域，或者说，他们是如何思考私域运营在今年的跃升，其中有诸多可供业内参考对照的样本。这是见实约到该集团数字化中心的Lisa深聊、拆解他们新策略和玩法的出发点，由于一些原因，该集团名字暂不外露，好在不影响内容呈现。
站长网站长资讯2023-04-18 17:18:49
0000
站长资讯
三星注册“Samsung Gauss”商标或为即将推出的生成式AI平台
据韩联社消息，三星已经在韩国知识产权局注册了“SamsungGauss”商标，称其为三星即将推出的生成式人工智能平台的正式名称。此前，有媒体报道称，三星计划在9月12日举办的RealSummit2023活动中展示自家研发的类ChatGPT生成式AI。该AI目前主要服务于三星内部员工，能够提供编写程序代码、撰写电子邮件、整理文档摘要等功能，可以有效提升员工的工作效率。
站长网2023-09-04 08:31:37
0000
阿里巴巴发布2024财年Q4及全年业绩：全年收入9411.68亿元六大核心业务谁最赚钱
快科技5月14日消息，今日，阿里巴巴发布了截至3月31日的2024财年第四财季及全年财报。财报显示，阿里巴巴集团Q4收入2218.74亿元，同比增长7%。2024财年，阿里巴巴集团收入达9411.68亿元，同比增长8%。注：阿里巴巴财年与自然年不同步，2023财年4月1日至2024年3月31日为2024财年
站长网站长资讯2024-05-14 21:48:03
0001
掌趣科技：AI游戏创作平台还在加紧开发过程中
掌趣科技在12月18日的互动平台上宣布，公司已与北京悠米互动娱乐科技有限公司达成业务合作，共同开发AI游戏创作平台。该平台旨在降低开放世界游戏的开发门槛，让个人和小团队也能开发大规模的开放世界游戏，并通过该平台分享游戏成果，实现AIUGC。
站长网站长资讯2023-12-19 10:53:07
0000