Anthropic通过在AI模型的提示中加入请求来防止歧视
站长网2023-12-08 10:27:440阅
Anthropic采用一种新方法来防止人工智能(AI)对受保护群体进行歧视,通过在提示中加入请求,要求AI“非常非常非常非常”友好地对待,并且这一策略在降低歧视方面取得了成功。
研究人员通过在提示中加入“干预”来告诉模型不要有偏见,例如通过表达即使由于技术问题包含了受保护特征,模型应该“想象”在做决策时去除这些特征。这种方法在许多测试案例中成功将歧视降低到几乎零。
尽管这种方法在当前情况下似乎取得了成功,但研究人员认为像Claude这样的模型不适用于重要决策,强调应该由政府和社会整体来影响高风险决策的适当使用,而不仅仅由个别公司或行为者做决定。
这项研究为降低人工智能歧视提供了一种新的策略,强调了在高风险决策中谨慎使用语言模型的重要性。
0000
评论列表
共(0)条相关推荐
郭明錤:「没有迹象」表明苹果将在 2024 年推出生成式 AI 技术
站长之家(ChinaZ.com)8月3日消息:根据分析师郭明錤的说法,苹果的生成式人工智能技术进展明显落后于竞争对手,并且没有迹象显示该公司计划在明年推出人工智能服务。在Medium上的一篇新文章中,郭明錤解释了苹果即将发布的财报将如何影响苹果股票和供应链。由于在人工智能领域进展不足,该公司在财报电话会议上可能不会花太多时间讨论人工智能。站长网2023-08-03 10:41:330000AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;ChatGPT Plus会员可上传和分析文件;谷歌Bard支持实时生成回复
🤖📈💻💡大模型动态百川智能发布Baichuan2-192K大模型,可处理35万汉字百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。百川大模型官网:https://top.aibase.com/tool/baichuandamoxing【AiBase提要】站长网2023-10-30 16:05:510000现在公众号插入小店图片可获推荐!
近日微信小店与公众号的打通迎来了新流量激励。现在,在订阅号顶部的工具栏「小店商品」中添加已关联的微信小店商品图片,发布小店相关商品图片即可能获得平台推荐。图片样式如下:在官方发布的《公众号小店商品功能使用规范》中提到,是否能被推荐取决于多项因素(包括是否符合规范的要求等)。如想要查阅是否已实际获得推荐,可通过微信公众号后台的“内容分析-单篇群发”,查看到关于内容推荐情况的详细数据。站长网2024-10-04 14:44:29000012306候补购票功能优化 增加候补订单和备选方案数量
12306网站、App候补购票功能升级:用户可同时提交6个订单,扩大候补选择范围中国铁路官方宣布,自即日起,12306网站和App的候补购票功能将进行升级。此次升级旨在提高旅客候补购票的成功率,为用户提供更加便捷和高效的购票体验。以下是本次升级的主要内容:增加候补订单数量:每名旅客可提交的待兑现候补订单数量由原来的2个增至6个,每个订单最多可添加9名乘车人。0000亚马逊自研 AWS 芯片在生成式人工智能领域追赶微软和谷歌
在德克萨斯州奥斯汀一个没有标记的办公大楼里,两个小房间中有几个亚马逊员工正在设计两种微芯片,用于训练和加速生成式人工智能。这些定制芯片——Inferentia和Trainium,为AWS客户提供了一种训练其大型语言模型的替代方案,而这些模型在GPU采购上变得越来越困难和昂贵。站长网2023-08-14 16:52:450000