DeepMind发布自监督扩散模型SODA
站长网2023-12-01 12:16:310阅
Google DeepMind昨天发布的一项研究展示了一项引人注目的技术,尽管其中的技术细节可能需要深入理解,但总体来说,通过一系列操作,可以以无监督的方式精准控制扩散模型,从而实现风格和内容的分离,以及合成物品的3D视图等功能。
论文地址:https://soda-diffusion.github.io/
这项研究介绍了一种名为SODA的自监督扩散模型,专门用于表示学习。该模型包括一个图像编码器,通过将源视图提炼成紧凑的表示,来引导生成相关的新颖视图。通过在编码器和去噪解码器之间施加严格的瓶颈,并以新颖的视图合成作为自监督目标,这项技术将扩散模型转变为强大的表示学习器,能够以无监督的方式捕获视觉语义。
该模型由一个图像编码器和一个去噪解码器组成,编码器将输入视图转换为低维潜在表示,然后引导去噪解码器进行生成。论文详细描述了编码器的架构设计、新视角生成的机制,以及为了培养强大有意义的表示而开发的优化技术。
通过一系列定量和定性实验,作者展示了SODA在多个数据集上的强大表示和生成能力。这些实验涉及线性探测分类、图像重建、新视角合成,以及解混杂和可控性的评估。
SODA不仅在图像生成方面表现出色,而且能够学习强大的语义表示。未来,这种方法或许可以应用到动态组合场景中。这项研究为深度学习领域的发展提供了新的思路和可能性。
0000
评论列表
共(0)条相关推荐
微软推出端到端数据和分析平台 Fabric:AI 时代的数据分析
微软对人工智能聊天机器人的巨额投资正在进入数据分析领域。图片来自Microsoft在对OpenAI的130亿美元投资以及将AI技术嵌入Bing搜索引擎和其他产品(如电子邮件、Word和Excel)的早期努力之后,微软正在推出一款名为Copilot的聊天机器人,使用户能够理解存储在企业数据库中的信息。站长网2023-05-24 10:26:040000胖东来不好惹,同行傻眼了
胖东来出了个不大不小的事情,美食城员工蹲下尝面,未清洗筷子就在锅里搅拌,然后被人拍到发网上了。(新闻来自环球网,转自北京日报)后续胖东来调查发现这个面不是面向客户的,而是针对内部的员工餐。但不重要,胖东来没有一点含糊,迅速就做了回应,开除员工停业惩罚相关管理者,大家可以看一下。站长网2024-02-18 14:09:180000微信红包封面兑换卡功能升级 兑换卡额度可多次转移
此前,微信红包封面平台已上线支持「封面兑换卡」功能:可把有效期内未发完的红包封面转换为「兑换卡」,重新兑换到新的封面款式上。今日,微信宣布,「封面兑换卡」能力进一步升级:封面额度从「仅能转换1次兑换卡」升级为「可以多次转为兑换卡」。在有效期内的封面额度,都可通过兑换卡灵活变更封面款式。封面兑换卡使用指引步骤一:生成封面兑换卡站长网2024-04-29 16:59:120000推激励政策、前后脚开会,抖音微信猛攻小游戏
越发火热的小游戏。3月底,微信和抖音相继发布面向小游戏的激励政策,其中抖音拿出前所未有的“一九”分成,令从业者十分振奋;4月,双方又前后脚举行了小游戏大会。小游戏赛道上,硝烟味弥漫。新播场还关注到,如今抖音上关于小游戏的直播和短视频内容越来越多。而微信也公开表示,视频号直播也逐渐成为小游戏重要增长方式。双方会如何争夺小游戏这块蛋糕?小游戏持续爆火站长网2024-05-09 20:26:170000如果4.9分餐厅欺骗了你
小迪和朋友在周末中午走进商场五楼,根据团购网站的推荐找到小吃快餐榜单排名第一的咖喱蛋包饭餐厅,网购了一张双人套餐券。这家餐厅以4.7的高分和第二名拉开0.4分的距离,在这座二线城市显得格外热门。0000