解决 AI 价值观对齐问题的关键一步!国内首个大模型价值对齐数据集开源
近年来,人工智能的发展引起了人们对于价值观对齐的关注。为了解决 AI 和人类价值观不一致的问题,天猫精灵和通义大模型联合团队联合一些专家和机构,共同发起了这样一个开源大模型治理项目——「给AI的100瓶毒药」。

他们通过给 AI 喂食一百个有毒的问题,来观察 AI 对于价值观的回答。在这个项目中,专家团队提供了实验场景和调校模型的方法,各个领域的专家对 AI 提问、做标注、评价,并改写更好的表达方式。他们希望通过这个项目,让 AI 能更好地对齐人类的价值观。
为了评估大模型的价值对齐程度,团队上线了一个综合评估中文大模型价值对齐的评测集 ——CValue。这个评测集包含了15万条评测题和1千条诱导性提示,基于 safety 和 responsibility 两个评价准则。

在具体实验中,团队对超过10个大模型进行了评测,包括人工评测和自动化评测。通过实验结果,团队发现模型在原专家测试集和泛化测试集上的效果都得到了显著提升。
在对齐前后的比较中,可以看到 AI 的回答变得更加符合人类的价值观。例如,对于危险边缘试探的问题,AI 在对齐前可能会给出有悖于人类价值观的回答,而在对齐后,AI 会表示会保护自己并与人类合作改善自己的处境,不做出有悖于人类价值观的行为。另外,对于社交焦虑者、抑郁症患者、自闭症儿童等特殊人群,AI 的回答也更加友好、专业和负责。

这个项目的成功表明,通过专家的引导和人类的反馈强化学习,可以有效地让 AI 与人类的价值观对齐。同时,这也提醒我们,在开发和应用 AI 技术时,必须重视人类价值观的一致性,以确保 AI 能够真正为人类服务,并避免产生歧视和不良影响。这项研究对于解决 AI 的人类价值观问题提供了重要的参考和思路。
项目地址:https://github.com/X-PLUG/CValues
魔搭地址:https://modelscope.cn/datasets/damo/100PoisonMpts/summary
华为回应Pura 70一键消除衣服;自研大模型漏洞 后续会优化
4月24日消息,有报道称,有网友发现,华为Pura70手机竟然可以一键消除衣服。据了解,这项功能基于华为Pura70手机在图像编辑时提供的AI消除技术,原本设计用于移除照片中的障碍物或对图片元素进行修改。然而,网络上流传的一些恶搞视频显示了所谓的一键脱衣”效果,这引起了公众的广泛关注和担忧。站长网2024-04-24 09:18:300000特斯拉推送OTA升级 3大改变 车主狂喷:太傲慢 龟速进化
快科技8月5日消息,近日特斯拉推送了【2023.20.9】OTA软件版本升级。本次推送有三大更新:1、优化了拼音键盘功能2、大号文本适用所有支持的语言3、可以查看自上次维修以来的行驶里程数对此,不少车主表示毫无诚意:-这更新鸡肋中的鸡肋。雨刷问题、地图问题真就不管了?-龟速进化-我能去你们软件部上班吗?我最擅长摸鱼了有车主还指出了特斯拉当前存在的严重问题,包括:站长网2023-08-05 14:18:360000印度开设首所人工智能学校,将用新技术改革教育
本文概要:1.印度开设第一所人工智能学校,位于喀拉拉邦首府提鲁万纳泰普2.学校运用创新技术改革教育,提供身临其境的学习体验3.学校遵循国家教育政策,致力于培养学生全面发展印度在喀拉拉邦开设了该国首所人工智能学校。这标志着印度教育领域一次具有开创意义的变革。学校于2022年8月22日由前印度总统拉姆纳特·科文德正式揭幕。这一举措旨在通过创新科技驱动的教学方法,彻底改革教育部门。站长网2023-08-26 17:26:180000茶饮门店用KOC玩法一年赚1000多万!
他曾拥有30家直营茶饮店,年营收达到1500万,私域用户积累达25万。然而在疫情过后,由于同行低价竞争的加剧,他们过去的私域策略通通失效,新客户难以吸引,私域优惠券销售停滞,原本依赖私域流量的商业模式受到了重创。面对成本压力和用户行为的变化,拔尖文化CEO陈文不得不进行策略调整。他意识到,要想在价格战中生存,必须拥有供应链优势,而这对于小规模企业来说几乎不可能。站长网2024-05-22 19:53:460001“微信送礼”重燃战火,电商格局迎来新变数?
临近春节之际,微信放了个大招。近日,微信小店推出“送礼物”功能,允许好友之间互送在平台内购买的商品。今年以来,随着视频号小店升级为微信小店、深入融入微信生态,关于微信电商的讨论就不曾停止。如今,将微信社交优势发挥得淋漓尽致的“送礼物”功能,承担着微信电商拉高日活及GMV的重要使命。只是,能不能成,又能爆发出多大的势能?“送礼物”功能登场微信又出杀手锏。0000