解决 AI 价值观对齐问题的关键一步!国内首个大模型价值对齐数据集开源
近年来,人工智能的发展引起了人们对于价值观对齐的关注。为了解决 AI 和人类价值观不一致的问题,天猫精灵和通义大模型联合团队联合一些专家和机构,共同发起了这样一个开源大模型治理项目——「给AI的100瓶毒药」。
他们通过给 AI 喂食一百个有毒的问题,来观察 AI 对于价值观的回答。在这个项目中,专家团队提供了实验场景和调校模型的方法,各个领域的专家对 AI 提问、做标注、评价,并改写更好的表达方式。他们希望通过这个项目,让 AI 能更好地对齐人类的价值观。
为了评估大模型的价值对齐程度,团队上线了一个综合评估中文大模型价值对齐的评测集 ——CValue。这个评测集包含了15万条评测题和1千条诱导性提示,基于 safety 和 responsibility 两个评价准则。
在具体实验中,团队对超过10个大模型进行了评测,包括人工评测和自动化评测。通过实验结果,团队发现模型在原专家测试集和泛化测试集上的效果都得到了显著提升。
在对齐前后的比较中,可以看到 AI 的回答变得更加符合人类的价值观。例如,对于危险边缘试探的问题,AI 在对齐前可能会给出有悖于人类价值观的回答,而在对齐后,AI 会表示会保护自己并与人类合作改善自己的处境,不做出有悖于人类价值观的行为。另外,对于社交焦虑者、抑郁症患者、自闭症儿童等特殊人群,AI 的回答也更加友好、专业和负责。
这个项目的成功表明,通过专家的引导和人类的反馈强化学习,可以有效地让 AI 与人类的价值观对齐。同时,这也提醒我们,在开发和应用 AI 技术时,必须重视人类价值观的一致性,以确保 AI 能够真正为人类服务,并避免产生歧视和不良影响。这项研究对于解决 AI 的人类价值观问题提供了重要的参考和思路。
项目地址:https://github.com/X-PLUG/CValues
魔搭地址:https://modelscope.cn/datasets/damo/100PoisonMpts/summary
微信公众平台优化调整客服消息接口 取消支付场景客服消息下发额度
微信公众平台运营中心发布《关于优化公众号客服消息接口能力的通知》称,部分公众号在用户无客服咨询和服务请求的情况下,通过客服消息接口主动向用户频繁下发营销内容,对用户造成骚扰影响。为优化用户体验,减少对用户骚扰,平台将优化调整客服消息接口:站长网2023-05-31 08:57:270003理论物理学家称聊天机器人造福社会并提高生产力
据CNN报道,理论物理学家米奇奥·卡库认为,公众对新的人工智能技术的焦虑是没有道理的。在周日与CNN的法里德·扎卡里亚的采访中,这位未来学家说,像OpenAI的ChatGPT这样的聊天机器人将有利于社会和提高生产力。但是恐惧使人们主要关注这些程序的负面影响,他称之为“华而不实的录音机”。站长网2023-08-14 11:35:450001视频号发布最新品牌激励计划 品牌商家可享十大权益
微信官方宣布,5月16日至7月16日期间,视频号品牌激励计划再次升级,符合条件的品牌商家将享有十大权益,服务商将享受三大激励。具体如下:品牌商家十大权益●入驻奖励:新入驻且成功上架10个商品,每家店铺即获2万流量券激励●促活激励:入驻90天后,每个月前50万的结算交易额,技术服务费实际减至1%,多收部分以流量券形式返回;自播开播即可获得千级到万级不等的UV即时流量激励。站长网2023-05-18 14:44:020001AI带货,卷不死真人主播
“这个行业现在还不太成熟。”与刺猬公社对谈的从业者,在说起AI数字人直播时,几乎都是相似的表态。生成式人工智能的风潮,让AIGC一度成为各行业寻求增量的关键因子,直播电商也并不例外。ChatGPT火爆后的数月,AI数字人席卷直播间的神话开始光速流传,“上百平的直播基地空无一人,AI主播24小时工作,低廉的成本下,直播间的订单却如雪花般飘来……”站长网2023-07-05 10:22:130000LexisNexis 推出全面可用的 Lexis+ AI:承诺为法律问题提供「无幻觉」的答案
站长之家(ChinaZ.com)10月26日消息:去年五月,LexisNexis首次透露了推出LexisAI的计划,这是一个新产品,将利用大型语言模型来回答法律研究问题、总结法律问题,并生成法律文档草稿。当时,它限制了对一些同意参与商业预览的AmLaw50强律师事务所的可用性。站长网2023-10-26 10:45:160000