ImageReward奖励模型:让文本到图像合成更符合人类偏好
Stable Diffusion 等生成式 AI 模型在文本到图像合成方面越来越受欢迎。像 CLIP 或 BLIP 这样的文本图像评分方法可以评估模型生成的图像是否与文本提示匹配,但它们并不总是符合人类的偏好和感知。
清华大学和北京邮电大学的团队开发了第一个通用的文本到图像的人类偏好奖励模型——ImageReward,主要解决改进生成模型(如 Stable Diffusion)中的各种普遍问题,接受了人类反馈的训练,并使它们与人类价值观和偏好保持一致。
ImageReward 使用强化学习和人类反馈进行训练,这是一种受 OpenAI 的 CLIP 启发的方法。ImageReward 已经接受了137,000个人工评分的 AI 图像训练,有望提供更好的图像合成。ImageReward 在各种基准测试中优于 CLIP、Aesthetic 或 BLIP 等其他评分方法30% 到近40%。
ImageReward 从根据各种标准对 AI 图像进行排名的人类评分中学习
在实践中,ImageReward 实现了更好的文本和图像对齐,减少了身体的扭曲渲染,更好地匹配了人类的审美偏好,并减少了毒性和偏见。该团队在几个示例中展示了 ImageReward 如何影响图像质量,他们让不同的文本图像评分器从64代图像中选择表现最优的图像。
与 CLIP 等其他文本图像评分方法相比,ImageReward 在大多数情况下都能产生更好的结果。
该团队希望在未来与研究界合作,找到将 ImageReward 用作 RLHF 中文本到图像模型的真正奖励模型的方法。ImageReward 可从 GitHub 获得,并提供了有关如何将其集成到 Stable Diffusion WebUI 中的说明。
ImageReward项目网址:
https://github.com/THUDM/ImageReward
微信状态可以评论了!仅评论双方可见
近日,许多微信用户发现微信状态现在可以进行评论了。与朋友圈评论不同的是,微信状态评论内容仅对双方可见,保证了好友间的隐私。不过,该功能似乎并未向所有用户开放,可能正在内测阶段。尽管有用户支持这一新玩法,但也有人认为它并不实用,只是增加了一些花里胡哨的高科技。有用户向微信喊话称,花里胡哨缓一缓,先加上语音二倍速功能。站长网2023-05-11 10:50:200000中国版FSD要来了!特斯拉和百度地图深度定制车道级高辅地图:已获批
快科技4月30日消息,日前,关于百度于特斯拉合作实现中国版FSD的消息引起广泛关注。虽然官方还没正式官宣,但是种种迹象已经表明了双方的合作关系。甚至还有媒体在自然资源部网站上发现,除了用于车机导航服务的《百度车机地图》(T版),百度地图近期也有多个《高级辅助驾驶地图》获得自然资源部批准。站长网2024-05-01 14:26:490000李佳琦、小杨哥等大主播纷纷“退隐”、“播二代”们能否成功接班?
2023年,直播电商市场规模达到4.9万亿元,同比增速为35.2%。行业依旧在释放增长信号,但“头部主播,无心直播”已是不争的事实。李佳琦在《披哥4》上演《阳光宅男》;小杨哥拍起了霸道总裁和替身新娘的微短剧;罗永浩则又又又一次创业。在电商头部主播纷纷“退隐”之际,他们的“徒弟”和“副将”则频繁亮相,大有走马上任之势。但种种迹象表明,播二代们尚未能够在市场的激流中站稳脚跟。站长网2024-08-16 08:30:420000剑掌双绝!《剑侠世界:起源》新门派峨眉技能实机首曝
剑掌双绝,普渡众生!西山居剑侠情缘26年传承之作《剑侠世界:起源》全新水系门派峨眉11月22日上线,今日技能视频首曝。峨眉门派剑掌双绝,剑峨眉主增益回血,能抗能奶;掌峨眉擅长远程输出,掌法精妙!峨眉武功亦柔亦刚,集飒爽、柔美一体!【峨眉技能特色:水系内功,剑掌双绝,亦柔亦刚】站长网2023-11-17 11:12:40000060行代码,从头开始构建GPT!最全实践指南来了
【新智元导读】GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南,仅用60行代码构建GPT。60行代码,从头开始构建GPT?最近,一位开发者做了一个实践指南,用Numpy代码从头开始实现GPT。你还可以将OpenAI发布的GPT-2模型权重加载到构建的GPT中,并生成一些文本。话不多说,直接开始构建GPT。什么是GPT?站长网2024-03-01 18:23:130000