新AI框架DreamSync:结合图像理解模型的反馈 改善文本到图像合成
**划重点:**
1. 🌐 DreamSync是由南加州大学、华盛顿大学、巴伊兰大学和谷歌研究团队引入的新型人工智能框架,致力于提高扩散型文本到图像(T2I)模型的对齐性和审美吸引力,无需人工标注、模型架构修改或强化学习。
2. 🚀 DreamSync通过生成候选图像,利用视觉问答(VQA)模型进行评估,并对文本到图像模型进行微调,成功解决了T2I模型中对齐和美感的挑战。该框架不依赖特定架构或标记数据,采用视觉语言模型(VLMs)鉴别生成图像与输入文本之间的差异。
3. 📈 DreamSync通过模型不可知的框架,结合VLMs的反馈,取得了在T2I模型上显著的对齐和视觉吸引力改进,超越了基准方法,拓展了在分布内外场景中的适用性。
来自南加州大学、华盛顿大学、巴伊兰大学和谷歌研究团队的研究人员推出了DreamSync,这是一种新型人工智能框架,致力于解决扩散型文本到图像(T2I)模型中对齐和审美吸引力的问题,而无需进行人工标注、修改模型架构或使用强化学习。
DreamSync的方法是通过生成候选图像,利用视觉问答(VQA)模型对其进行评估,然后对文本到图像模型进行微调。此过程无需特定的架构或标记数据,采用了模型不可知的框架,并利用视觉语言模型(VLMs)来识别生成的图像与输入文本之间的差异。该框架的关键步骤包括生成多个候选图像,使用两个专用的VLMs对它们进行文本忠实度和图像美感的评估,然后选择VLM反馈确定的最佳图像进行文本到图像模型的微调,迭代至收敛。
此外,框架还引入了迭代自举方法,利用VLMs作为教师模型对未标记数据进行标记,用于T2I模型的训练。
DreamSync成功提升了SDXL和SD v1.4T2I模型的性能。在TIFA上进行的实验显示,对SDXL进行三次迭代,文本忠实度提高了1.7%和3.7%,视觉美感提高了3.4%。将DreamSync应用于SD v1.4,文本忠实度提高了1%,TIFA上的得分绝对增加了1.7%,美感提高了0.3%。
在与SDXL的比较研究中,DreamSync在对齐方面表现更好,生成的图像具有更相关的组件和3.4个更正确的答案。在TIFA和DSG基准测试中,DreamSync实现了更卓越的文本忠实度,而不损害视觉外观,显示出随着迭代的逐渐改进。
DreamSync是一个多功能的框架,在具有挑战性的T2I基准测试中进行了评估,显示出在分布内外场景中对齐和视觉吸引力方面的显著改进。该框架结合了来自视觉语言模型的双重反馈,并通过人类评分和偏好预测模型进行了验证。
未来,DreamSync的改进方向包括通过详细注释(如边界框)来巩固反馈,调整每次迭代的提示以针对文本到图像合成中的特定改进,探索语言结构和注意力图以增强属性-对象绑定,以及使用人类反馈训练奖励模型,以进一步使生成的图像与用户意图一致。同时,拓展DreamSync的应用到其他模型架构,并在不同场景中进行性能评估和额外研究也是未来持续调查的方向。
论文网址:https://arxiv.org/abs/2311.17946
天猫精灵公司申请“未来精灵大模型”等商标
天眼查App显示,9月5日,天猫精灵关联公司浙江艾克斯精灵人工智能科技有限公司申请注册多个“精灵大模型”“未来精灵大模型”商标,国际分类为广告销售、教育娱乐、通讯服务等,当前商标状态均为申请中。站长网2023-09-11 13:55:300000腾讯推加强版InstantID项目OMG:让ID身份保持从一人变多人
腾讯近日推出了一项名为OMG的新研究,这项研究支持在一张图片中生成多角色多概念。这是一个突破性的进展,因为以前的ID或概念保持项目只能将一个人还原在图片里面,而有了这个项目以后,就可以实现多人合照了。项目地址:https://top.aibase.com/tool/omg站长网2024-03-19 17:02:450000智源研究院开源 AI 硬件评测引擎FlagPerf v1.0
智源研究院发布了FlagPerfv1.0,这是一个开源开放的AI硬件评测引擎。FlagPerf的评测指标体系包括功能正确性指标、性能指标、资源使用指标和生态适配指标。其中,功能正确性指标验证芯片对模型运行的支持,性能指标评估芯片的训练时间和计算吞吐量,资源使用指标衡量芯片和服务器其他零部件的使用情况,生态适配指标考察芯片对不同框架和软件生态的支持能力。站长网2023-09-28 08:46:260001普华永道与 OpenAI 合作,为10万员工提供 ChatGPT 服务
划重点:⭐普华永道成为OpenAI最大客户和首家经销商⭐生成式AI应用场景化落地,助力员工、客户降本增效⭐普华永道将推广ChatGPT等产品,并使用GPT-4o模型进行定制化应用站长网2024-05-30 10:37:500000618天猫宝藏新品牌榜单出炉!11大热门行业,谁将登顶?
2024年,众多消费品企业面临着一个全新的课题——质价比和心价比。前者是在大环境和经济形势下,消费者更愿意购买更具价格力的好货,但价格力并不意味着牺牲品质;后者是消费者为自己的情感诉求买单,为感受体验支付“溢价”。消费趋势的背后,是消费情绪、消费风向在变,基于此,商家、平台都正在重新理解生意。站长网2024-06-24 02:08:010000