何恺明与MIT合作推出自条件图像生成框架RCG
要点:
何恺明与MIT合作推出的新自条件图像生成框架RCG在ImageNet-1K数据集上取得了无条件图像生成的新SOTA成绩,无需人类注释,保真且多样。
RCG框架基于类似自监督学习的自条件生成方法,利用表示扩散模型RDM生成低维自监督图像表示,通过SSL图像编码器和MAGE像素生成器实现图像生成。
RCG在ImageNet256×256上实现了3.56的FID和186.9的IS得分。
近期,何恺明与MIT合作推出的自条件图像生成框架RCG在学术圈引起关注。这一框架成功填补了长期存在的有条件和无条件生成任务性能差距,取得了ImageNet-1K数据集上无条件图像生成的新SOTA成绩。
RCG的设计灵感来源于自监督学习,通过表示扩散模型RDM生成低维自监督图像表示。这一表示条件图像生成架构包括SSL图像编码器、RDM和MAGE像素生成器,结构简单而高效。
论文地址:https://arxiv.org/pdf/2312.03701.pdf
为了实现无条件图像生成,RCG的关键在于将图像分布转换为紧凑的表示分布,通过SSL图像编码器实现。RDM模型用于对表示分布进行建模和采样,具有多样性强、计算开销小的优点。最后,MAGE像素生成器根据表示来处理图像像,通过向token化的图像中添加随机掩码并要求网络以条件重建丢失的token,实现图像生成。
RCG在ImageNet256×256上的表现令人瞩目,取得了3.56的FID和186.9的IS得分,相较于之前最先进的无条件生成方法有着显著提升。不仅如此,RCG在无分类器引导的情况下,成绩还能进一步提高到3.31(FID)和253.4(IS)。这一成果展示了自条件图像生成模型的潜力,为图像生成领域带来了新的可能性。
总的来说,何恺明与MIT的合作研究为无条件图像生成领域带来了新的突破,RCG框架的成功应用表明自条件图像生成模型具有巨大的潜力,可能预示着这一领域新时代的到来。
从分账1.5亿到拉拢周星驰,内容平台狂卷微短剧
短剧正在成为各大平台的“当红炸子鸡”。近日,微信视频号加热工具内测支持挂载小程序微短剧,从业者可直接在微信付费推广短剧。从上线短剧专区到支持短剧付费推广,微信正在向短剧加速开放自己10亿日活的流量池。中商产业研究院预估,2024年国内短剧规模将超504.4亿元,艾媒咨询则更加大胆,认为2027年微短剧市场规模将达到1006.8亿元。站长网2024-03-23 13:49:4900009月国产游戏版号下发 89 款游戏获批
昨日,国家新闻出版署公布9月国产网络游戏过审版号名单,其中,分别有81款移动端游戏、1款客户端游戏、6款移动端-客户端双端游戏顺利获批。此外还包括了一款Switch游戏《失落城堡》。本次过审游戏包含了《无边存在》《阿瑞斯病毒2》《出发吧麦芬》《淡墨水云乡》《竹马胭脂铺》《卡牌迷境》等。0000DeepMind联合创始人启动测试:挑战AI在零人工干预下赚百万美元
我们知道人工智能可以编写、添加任务并确定任务的优先级。但它在没有人工的帮助下独立赚到100万美元吗?站长网2023-08-02 16:14:260000蚂蚁集团入股认知大模型研发公司智谱AI
天眼查显示,10月17日,北京智谱华章科技有限公司发生工商变更,新增股东为蚂蚁集团子公司上海云玡企业管理咨询有限公司。站长网2023-10-18 21:20:110000淘宝修改销量显示规则 由30天月销变为近365天已售件数
淘宝最近修改了销量显示规则,将原来的30天月销改为显示近365天累计已销售件数,并排除了不诚信经营和售中退款等销量。这一改变对于用户、商家和平台都是利好。首先,这个规则鼓励商家在平台上实现长久稳健经营,打造长远品牌。其次,对于新品和新商家,淘宝提供了更多机会,促进创新和原创保护。最后,这一规则激发了中小商家的活力,帮助他们获得持续激励。站长网2023-08-19 15:33:110000