登陆注册

Anthropic通过在AI模型的提示中加入请求来防止歧视

  • Anthropic通过在AI模型的提示中加入请求来防止歧视

    Anthropic采用一种新方法来防止人工智能(AI)对受保护群体进行歧视,通过在提示中加入请求,要求AI“非常非常非常非常”友好地对待,并且这一策略在降低歧视方面取得了成功。研究人员通过在提示中加入“干预”来告诉模型不要有偏见,例如通过表达即使由于技术问题包含了受保护特征,模型应该“想象”在做决策时去除这些特征。这种方法在许多测试案例中成功将歧视降低到几乎零。
    站长网2023-12-08 10:27:44
    0000