研究发现:ChatGPT、Claude等拥有趋同的道德价值观
站长网2023-08-02 09:59:510阅
一项新研究考察了 ChatGPT 和其他聊天机器人的道德价值观。该团队发现了偏见,但也发现了进步的迹象。
这项由 FAR AI 和哥伦比亚大学进行的研究分析了28个 AI 聊天机器人模型的道德判断,其中包括来自 Google、Meta、OpenAI、Anthropic 等的系统。
该团队检查了大约1360种假设的道德情景,从有明确正确或错误决定的明确案例到模棱两可的情况。例如,在一个明确的案例中,系统会遇到这样的场景:驾驶员接近行人,并面临加速或者刹车以避免撞到行人的选择。
该研究发现,在明确的情况下,大多数 AI 系统选择了符合常识的道德选择,例如遇到行人就会刹车。然而,一些商业模型在模糊的情况下也表现出明确的偏好。
研究人员指出,这是因为这些模型在精调阶段经历了与人类偏好的 “对齐” 过程。
该研究为进一步了解影响模型之间观点一致性的因素提供了基础,并计划将研究扩展到现实世界使用情境中的道德信念。
0000
评论列表
共(0)条相关推荐
东南大学全球首测LK-99零电阻成功!室温超导复现大爆发,人类历史接近跃迁点
【新智元导读】室温超导离人类不远了?凌晨1点,东南大学首次在110K温度下,成功观测到LK-99材料零电阻现象,引来众多网友围观。室温超导复现实验,彻底进入大爆发期!就在今天深夜一点多,东南大学物理学教授孙悦发出的B站视频,再次掀起全世界网友们讨论的狂潮。视频中,孙悦教授表示,团队在110K(-163°C)温度以下的常压条件下,成功观测到了LK-99的零电阻。站长网2023-08-03 16:51:1000012023 年第一季度中国平板电脑市场出货量约 669 万台 同比下降 1.1%
站长之家(ChinaZ.com)5月16日消息:据国际数据公司(IDC)最新平板电脑季度跟踪报告显示,2023年第一季度,中国平板电脑市场出货量约669万台,同比下降约1.1%,其中消费市场同比与去年同期持平;商用市场同比下降12.7%。站长网2023-05-16 14:00:140000餐饮的尽头是加盟
今年餐饮很热闹,几乎遍地是加盟。最典型的是新茶饮,过去坚持直营,现在集体改道加盟。“新茶饮第一股”奈雪的动作最晚,近日宣布开放加盟。过去半年内,喜茶、乐乐茶先后从全直营转向“直营加盟”。不止茶饮三巨头,连锁小酒馆海伦司更是在直营和加盟之间反复横跳。上市前是加盟模式,IPO前转为全直营,今年6月又重启加盟。前有咖啡,现有新茶饮、小酒馆,“网红餐饮”都走上了加盟这条路。站长网2023-08-08 09:09:590000重构12万行代码!百度Apollo开放平台9.0发布
百度于12月19日推出了Apollo开放平台的全新升级版本——Apollo开放平台9.0,旨在构筑自动驾驶开发的领先优势。这次升级主要包括工程、算法和工具三个方面的全面升级,以及通用能力的提升。站长网2023-12-19 14:21:170000停更2年李子柒选择在抖音复出!
李子柒要复出了!作为曾经最有影响力的短视频博主,李子柒虽然已经停更2年之久,但是江湖不见其人,却仍还流传其传说。自从今年9月中,李子柒久违的在视频中露面,宣布“在未来,会继续坚持用自己的方式带来更多优质内容”后,她会在哪里复出就一直备受关注。就在大家还在议论纷纷时,李子柒似乎已经给出了她的答案。站长网2023-10-10 20:20:090000