ImageReward奖励模型：让文本到图像合成更符合人类偏好

站长网2023-05-08 11:19:086阅

Stable Diffusion 等生成式 AI 模型在文本到图像合成方面越来越受欢迎。像 CLIP 或 BLIP 这样的文本图像评分方法可以评估模型生成的图像是否与文本提示匹配，但它们并不总是符合人类的偏好和感知。

清华大学和北京邮电大学的团队开发了第一个通用的文本到图像的人类偏好奖励模型——ImageReward，主要解决改进生成模型（如 Stable Diffusion）中的各种普遍问题，接受了人类反馈的训练，并使它们与人类价值观和偏好保持一致。

ImageReward 使用强化学习和人类反馈进行训练，这是一种受 OpenAI 的 CLIP 启发的方法。ImageReward 已经接受了137，000个人工评分的 AI 图像训练，有望提供更好的图像合成。ImageReward 在各种基准测试中优于 CLIP、Aesthetic 或 BLIP 等其他评分方法30% 到近40%。

ImageReward 从根据各种标准对 AI 图像进行排名的人类评分中学习

在实践中，ImageReward 实现了更好的文本和图像对齐，减少了身体的扭曲渲染，更好地匹配了人类的审美偏好，并减少了毒性和偏见。该团队在几个示例中展示了 ImageReward 如何影响图像质量，他们让不同的文本图像评分器从64代图像中选择表现最优的图像。

与 CLIP 等其他文本图像评分方法相比，ImageReward 在大多数情况下都能产生更好的结果。

该团队希望在未来与研究界合作，找到将 ImageReward 用作 RLHF 中文本到图像模型的真正奖励模型的方法。ImageReward 可从 GitHub 获得，并提供了有关如何将其集成到 Stable Diffusion WebUI 中的说明。

ImageReward项目网址:

https://github.com/THUDM/ImageReward

ImageReward奖励模型让文本到图像合成更符合人类偏好

0006

评论列表

共(0)条

相关推荐

站长资讯
从小红书首届创作者获奖名单里，我们读到了这些信号
小红书给创作者颁奖了，我们第一时间拿到了获奖名单。从这份名单里，我们看到了一些官方说了的以及还没说的信号。8月30日，小红书举行了一场创作者开放日活动——“熟人300·创作者年度见面会”，除了公布了小红书的“熟人300”名单之外，对其中表现突出的创作者颁发的16个奖项是最大看点。
站长网2024-09-03 17:07:23
0000
站长资讯
突破性AI方法WHAM：精确有效地预测视频中3D人体运动
**划重点:**1.🌐WHAM（World-groundedHumanswithAccurateMotion）方法成功结合3D人体运动和视频背景，实现精准的全球坐标下3D人体运动重建。2.💡该方法通过模型自由和基于模型的方法，利用深度学习技术，有效地从单眼视频中准确估计3D人体姿态和形状。
站长网2023-12-15 16:21:47
0001
站长资讯
预计到 2025 年 AI 服务器市场规模将激增至 1350 亿美元
站长之家(ChinaZ.com)8月7日消息:今年以来，人工智能（AI）服务器市场迎来了热潮，AletheiaCapital发布了最新报告，称赞图形芯片制造商英伟达将受益于AI服务器和GPU加速器的强劲增长，并将目标股价调高至1000美元，引起了广泛的讨论。
站长网2023-08-07 18:09:07
0002
站长资讯
苹果取消电动车计划，转向聚焦生成式AI
划重点:1.🚗苹果宣布取消自动驾驶电动车项目，将2，000名员工调配至生成式AI项目。2.🤖生成式AI团队由JohnGiannandrea领导，专注于大型语言模型应用，如AI聊天机器人（比如ChatGPT）。3.📉部分员工将面临裁员，苹果自2014年启动电动车计划，最近推出的AppleVisionPro为混合现实头戴设备。
站长网2024-02-28 09:51:10
0000
站长资讯
AI视野：百度希壤与高通达成合作；gpt4最强对手claude pro上线；快手内测AI文生图功能；Vercel发布界面生成器v0.dev
🤖📱💼AI应用gpt4迎来最强对手，claudepro正式上线Anthropic推出面向消费者的高级订阅计划ClaudePro，该计划每月收费20美元，相比于免费版Claude2，拥有更多的使用量、早期访问新功能的权限和更强大的上下文处理能力。然而，与ChatGPTPlus相比，ClaudePro在信息准确性方面稍逊一筹。要点:
站长网2023-09-15 16:28:35
0000