Anthropic通过在AI模型的提示中加入请求来防止歧视

站长网2023-12-08 10:27:440阅

Anthropic采用一种新方法来防止人工智能（AI）对受保护群体进行歧视，通过在提示中加入请求，要求AI“非常非常非常非常”友好地对待，并且这一策略在降低歧视方面取得了成功。

研究人员通过在提示中加入“干预”来告诉模型不要有偏见，例如通过表达即使由于技术问题包含了受保护特征，模型应该“想象”在做决策时去除这些特征。这种方法在许多测试案例中成功将歧视降低到几乎零。

尽管这种方法在当前情况下似乎取得了成功，但研究人员认为像Claude这样的模型不适用于重要决策，强调应该由政府和社会整体来影响高风险决策的适当使用，而不仅仅由个别公司或行为者做决定。

这项研究为降低人工智能歧视提供了一种新的策略，强调了在高风险决策中谨慎使用语言模型的重要性。

Anthropic通过在AI模型的提示中加入请求来防止歧视

0000

评论列表

共(0)条

相关推荐

站长资讯
京东回应诺亚恶意起诉称诺亚转移矛盾误导投资人
刚刚，京东集团发布声明称，近日，“承兴案”引发媒体和公众广泛关注。京东作为毫不知情的受害者，被卷入历时四年的恶意诉讼中，公司的声誉和权益遭受重大损失。
站长网2023-12-04 14:12:33
0000
站长资讯
SK 海力士称内存芯片复苏已经开始人工智能需求强劲
韩国SK海力士周三表示，由于人工智能需求强劲，内存芯片市场正在从严重低迷中复苏，尽管其报告显示第二季度运营亏损。特别是企业买家和游戏个人电脑对内存芯片的需求预计将在今年下半年比上半年增加，这家全球第二大内存芯片制造商在一份声明中表示。
站长网2023-07-26 11:20:48
0000
站长资讯
攻克Midjourney难题！AI图像生成器Ideogram轻松搞定文字、数字类LOGO
文章概要:1.Ideogram是一个新成立的AI图像生成初创公司，由前GoogleBrain研究人员创立。2.Ideogram的图像生成器在可靠地生成图像内文本（如LOGO上的字母）方面表现突出。3.Ideogram已推出公测版，其可靠的排版功能可能吸引平面设计师的兴趣。
站长网2023-08-26 16:14:32
0003
站长资讯
续航能力提升！vivo X100 Pro首发蓝海电池
vivoX100Pro将首发采用蓝海电池，据官方介绍，蓝海电池突破了电池技术瓶颈，带来了超乎寻常的续航能力，彻底告别电量焦虑。据供应链消息透露，vivo与宁德新能源合作研发了这款蓝海电池，通过合作打造了一整套全新能源供给系统，覆盖了基础材料、化学体系、制程工艺等全流程。这一系统提升了锂离子传输效率，从而提高了手机续航能力，并且闪充技术也得到了同步提升。
站长网2023-11-10 11:57:36
0000
贴身追随OpenAI的中国公司，从智谱换成了月之暗面
大洋彼岸的OpenAI系列春晚还在继续，连续发布会的第9天，OpenAI正式发布了o1模型的API。对已发布的圣诞季特别功能们略作盘点:满血版o1模型VSChatGPTPro订阅计划、年初引爆全球的鸽王——视频生成模型Sora全面开放、全新Canvas写作功能、ChatGPT正式接入苹果全家桶、GPT-4o的视频通话和屏幕共享功能，重构AI协作模式的复杂项目Projects……
站长网站长资讯2024-12-19 14:25:26
0000