登陆注册

Parrot提出新型多重奖励强化学习框架以改进文本生成图像

  • Parrot提出新型多重奖励强化学习框架以改进文本生成图像

    **划重点:**-🔄**多奖励优化:**Parrot是一种用于文本生成图像的多重奖励强化学习(RL)框架,采用联合优化方法,有效解决了奖励过度优化和降级问题。-📊**质量度量改进:**与使用单一奖励模型相比,Parrot框架在美学、图像情感和人类喜好等多个质量指标上取得了显著改进。
    站长网2024-01-16 07:01:20
    0001