MIT与Adobe联手开发DMD:生成图像质量媲美Stable Diffusion ,速度快30倍
**划重点:**
1. 🔄 **创新方法:** 研究团队提出了分布匹配蒸馏(DMD)方法,将扩散模型转化为一步图像生成器,在保持图像质量的同时显著减少神经网络评估次数。
2. 🌐 **数据优化:** 通过对文本到图像数据进行精细调整,研究团队成功解决了在通用文本到图像数据上扩大模型的难题,实现了高效的图像生成。
3. 📈 **性能超越:**速度超越 StableDiffusion v1.5,图像质量相当。利用扩散模型逼真地生成图像,通过训练两个扩散模型估计真假分布的得分函数,采用梯度更新生成器,使图像更逼真,虚假度更低。
MIT和Adobe的研究人员最近提出了一种新颖的人工智能方法,称之为分布匹配蒸馏(DMD),该方法旨在将扩散模型转化为一步图像生成器,从而显著提高图像生成的效率和质量。据称他们的一步生成器(Gθ)在生成逼真图像方面不仅与 StableDiffusion v1.5相媲美,而且速度更快30倍。
创新方法方面,传统的扩散模型在图像生成方面取得了巨大的进展,但其采样过程相对繁琐,需要通过逐步去噪的迭代过程逐渐减少高斯噪声样本中的噪声,这限制了生成管道作为创意工具时的交互性。与此不同,DMD方法通过将初始多步扩散采样找到的噪声→图像映射压缩成单通道学生网络,加速采样过程。通过这一创新,DMD成功解决了高昂的神经网络评估成本的问题,使得一步生成器在多项任务上表现优越。
在数据优化方面,研究团队通过在文本到图像数据上进行精细调整,不仅学习了数据分布,还学习了蒸馏生成器正在产生的虚构分布。这一方法通过利用预训练扩散模型的去噪扩散输出来解释梯度方向,从而推动人工生成图像向更真实和 less 虚构的方向发展。
性能超越方面,DMD在多项任务中都取得了令人瞩目的成绩。在ImageNet上,其FID指标达到2.62,比一致性模型提升了2.4倍。
此外,DMD在MS COCO2014-30k上获得了11.49的竞争性FID,同时保持了与更昂贵的Stable Diffusion模型相媲美的图像质量。值得注意的是,DMD方法在减少神经网络评估次数的同时,能够在FP16推断下以每秒20帧的速度生成512×512的图像,为交互式应用开辟了许多可能性。
研究团队通过结合分布匹配方法、GANs和pix2pix的灵感和见解,展示了DMD方法如何通过使用扩散模型来建模真实和虚构分布,并通过简单的回归损失匹配多步扩散输出,训练出高保真的一步生成模型。通过在多个任务上的验证,DMD一步生成器在各项基准测试中均表现优异,包括一致性模型、渐进蒸馏和矫正流等。
这一研究为图像生成领域带来了崭新的可能性,通过创新的方法,使得生成模型在效率和质量方面都取得了显著提升。
项目网址:https://tianweiy.github.io/dmd/
论文网址:https://arxiv.org/abs/2311.18828
从100到3万美元,邮件订阅的低成本高收益秘诀
分享独立开发、产品变现相关内容,每周五发布(合集:ezindie.com)目录1、aivideo:让图片会说话2、animstats:生成引人注目的gif/视频动画3、typingmind:一个更好的ChatGPT用户界面4、toktools:专注Tiktok的周边工具矩阵5、从100到3万美元,邮件订阅业务的低成本高收益秘诀1、aivideo:让图片会说话站长网2024-03-02 11:02:320002爱尔兰传统报媒为刊发AI生成恶作剧文章道歉
日前,有着150年历史的有影响力的报纸《爱尔兰时报》为在发表一篇人工智能生成的恶作剧文章而道歉。据悉,这篇题为“爱尔兰女性对假棕褐色的痴迷是有问题的”的文章是由假的AI生成的“记者”撰写的。据报道是该报有史以来阅读量第二高的文章,并在网上和广播中引发了讨论。站长网2023-05-17 10:46:200000科大讯飞:华为昇腾910B能力基本可对标英伟达A100
据科大讯飞投资者关系活动记录表显示,针对“美国进一步限制英伟达面向中国出口高端芯片”一事,科大讯飞回应称,科大讯飞已于2023年初与华为昇腾启动专项攻关,合力打造我国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上,当前华为昇腾910B能力已经基本做到可对标英伟达A100。在即将举行的科大讯飞1024全球开发者节上,公司和华为在人工智能算力底座上将有进一步联合发布。站长网2023-10-20 11:22:340001去夕阳团、老年大学、老年食堂薅羊毛,年轻人“蹭老式”消费真赚到了?
本着“我可以买贵的,但不能买贵了”的原则,这届年轻人正在所有消费领域扫货,这一次他们把目标瞄准了薅老年福利的羊毛。年轻人报名参加老年夕阳红旅行团,8天新疆游的价格只要4000多元,而日常面向年轻人的旅行团动辄上万元;年轻人打卡以老年顾客为主的社区食堂,两荤一素不过20元,还不用吃预制菜;年轻人涌入老年大学上兴趣班,一学期课程可能比市面上培训机构一节课还要便宜。站长网2023-11-05 10:34:500000普华永道发布2025年AI预测:AI Agents将劳动力提升1倍
全球四大会计事务所之一的pwc(普华永道)发布了2025年AI领域6大预测报告。普华永道表示,生成式AI的出现,使得开发AI应用变得更加容易。一个通用的大模型只需进行少量定制,就能打造适用于金融、财务、开发、客服等不同领域的产品。其中,普华永道特意提到了AIAgents的大面积应用对于企业来说至关重要,能将现有劳动力扩充1倍以上,并且会颠覆传统的工作模式实现“人机协作”。0000