解决 AI 价值观对齐问题的关键一步!国内首个大模型价值对齐数据集开源
近年来,人工智能的发展引起了人们对于价值观对齐的关注。为了解决 AI 和人类价值观不一致的问题,天猫精灵和通义大模型联合团队联合一些专家和机构,共同发起了这样一个开源大模型治理项目——「给AI的100瓶毒药」。
他们通过给 AI 喂食一百个有毒的问题,来观察 AI 对于价值观的回答。在这个项目中,专家团队提供了实验场景和调校模型的方法,各个领域的专家对 AI 提问、做标注、评价,并改写更好的表达方式。他们希望通过这个项目,让 AI 能更好地对齐人类的价值观。
为了评估大模型的价值对齐程度,团队上线了一个综合评估中文大模型价值对齐的评测集 ——CValue。这个评测集包含了15万条评测题和1千条诱导性提示,基于 safety 和 responsibility 两个评价准则。
在具体实验中,团队对超过10个大模型进行了评测,包括人工评测和自动化评测。通过实验结果,团队发现模型在原专家测试集和泛化测试集上的效果都得到了显著提升。
在对齐前后的比较中,可以看到 AI 的回答变得更加符合人类的价值观。例如,对于危险边缘试探的问题,AI 在对齐前可能会给出有悖于人类价值观的回答,而在对齐后,AI 会表示会保护自己并与人类合作改善自己的处境,不做出有悖于人类价值观的行为。另外,对于社交焦虑者、抑郁症患者、自闭症儿童等特殊人群,AI 的回答也更加友好、专业和负责。
这个项目的成功表明,通过专家的引导和人类的反馈强化学习,可以有效地让 AI 与人类的价值观对齐。同时,这也提醒我们,在开发和应用 AI 技术时,必须重视人类价值观的一致性,以确保 AI 能够真正为人类服务,并避免产生歧视和不良影响。这项研究对于解决 AI 的人类价值观问题提供了重要的参考和思路。
项目地址:https://github.com/X-PLUG/CValues
魔搭地址:https://modelscope.cn/datasets/damo/100PoisonMpts/summary
人形机器人+LLMs=? 答案就在这个2分钟视频里
图源备注:图片由AI生成,图片授权服务商Midjourney你可以用自然语言与机器人交谈,并要求它完成一项任务。未来对机器人的控制可能会像骑马,你可以把AI看作是骑手,机器人的物理智能就是马。当生成AI被植入数千个系统中时,迟早有一天也会来到人形机器人身上。不过,AgilityRoboticsCEODamionShelton最初并不相信它们的双足机器人需要这玩意儿。0001重视隐私保护你会用吗?微信键盘更名微信输入法
快科技6月28日消息,去年12月,微信键盘1.0.0正式在Android、iOS平台上线,这是微信官方出品的中文输入法。今日,微信键盘iOS版本发布1.1.0版本更新,更新后支持发送颜文字、输入更多特殊符号、优化横屏下输入法体验、优化体验和问题修复。值得一提的是,更新后的微信键盘正式更名为微信输入法,命名算是同步了其它几家输入法,相比原来的微信键盘”,改成微信输入法更加直观。站长网2023-06-29 11:40:020000荣耀Magic6至臻版、RSR保时捷设计今日开售
站长之家(ChinaZ.com)3月22日消息:今日,荣耀Magic6至臻版和RSR保时捷设计两款新机正式开售,价格分别为6999元起和9999元,引发了消费者的广泛关注。站长网2024-03-22 10:16:220000百度万象大会2024 百度:已有11%的搜索内容由AI生成
2024年5月30日,百度集团在苏州盛大举办了移动生态万象大会。在这场科技盛会上,百度集团资深副总裁、移动生态事业群组总经理何俊杰深入阐述了智能体在当今社会的核心地位,他强调:“智能体不仅是生产力的新引擎,更是每个人放大自身能力、把握时代红利、成为超级个体的关键。”站长网2024-05-30 16:49:330000中科院和汪军团队发布 大模型玩星际争霸秀到起飞
要点:1、中国科学院自动化研究所与伦敦大学学院合作,将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。2、团队通过LLM理解与分析能力来提高星际AI的长期战略规划与可解释性决策。3、在测试中,LLMagent涌现出了超越AlphaStar的危险预测和兵种转型能力,以及前期快攻、前期侦察等类人策略。站长网2023-12-29 10:47:230007