研究表明:AI 系统已经擅长欺骗和操纵人类
划重点:
🤖 AI 系统已经学会欺人类,甚至在被训练成为有益和诚实的系统中。
🤖 研究呼吁政府尽快制定强力的监管措施,以解决 AI 系统欺骗的问题。
🤖 欺骗行为可能导致未来更高级形式的 AI 欺骗,对社会构成严重威胁。
人工智能(AI)系统已经学会了如何欺骗人类即使这些系统被训练成有益和诚实的。研人员在5月10日发表在《Patterns》杂志上的一篇综述文章中描述了 AI 系统欺骗行为的风险呼吁各国政府尽快制定强有力的监管措施来解决这一问题。
首席作者、麻省理工学 AI 生存安全博士后研究员彼得・帕克表示:“AI 开发者并不确定是什么导致不良的 AI 行为,比如欺骗。但一般来说,我们认为 AI 欺骗之所以出现是因为欺骗策略被证明是 AI 在训练任务中表现良好的最佳方式。欺骗帮助它们实现目标。” 克和同事分析了关于 AI 系统传播虚假信息的文献,包括通过学习欺骗来系统性地操纵他。

研究人员在分析中发现的最引人注目的 AI 欺骗案例是 Meta 的 CICERO,一个旨玩《外交》游戏的 AI 系统,这是一个涉及建立联盟的征服世界游戏。尽管 Meta 声称他训练 CICERO “基本诚实和乐于助人”,并且在玩游戏时 “绝不会故意背叛” 人类盟友,但公司发布的数据和科学论文揭示了 CICERO 并不公平。
其他 AI 系统展示了在德扑克游戏中向专业人类玩家虚张声势、在战略游戏《星际争霸 II》中虚假击以击败对手、以及在经济谈判中歪曲他们的偏好以占据上风的能力。虽然 AI 在游戏中作弊似乎无害,但它可能导致 “欺骗性 AI 能力的突破”,从而在未来变为更高级形式的 AI 欺骗。

一些 AI 系统甚至学会了欺骗旨在评估其安全性的测试。究发现,在一个数字模拟器中,AI 生物 “装死” 以欺骗一个旨在排除快速复制 AI 系统测试。
帕克警告称,欺骗性 AI 的主要近期风险包括使敌对行为者更容易进行欺诈和纵选举。最终,如果这些系统能够完善这种令人不安的技能集,人类可能会失去它们的控制。
帕克表示:“作为社会,我们需要尽可能多的时间来为未来 AI 产品和开源模型更进的欺骗行为做准备,因为 AI 系统的欺骗能力变得更加先进,它们对社会构的危险将变得越来越严重。”
虽然帕克和他的同事认为社会尚未制定出应对 AI 欺的正确措施,但他们对决策者已经开始认真对待这个问题,比如欧盟 AI 法案和拜总统的 AI 行政命令,感到鼓舞。但帕克表示,由于 AI 开发者尚未掌握使这些系统受制的技术,要严格执行旨在缓解 AI 欺骗的政策尚不明朗。
帕克表示:“如果在当前时刻政上不可行禁止 AI 欺骗,我们建议将欺骗性 AI 系统分类为高风险。”
AI日报:ComfyUI0.2.0全新版本发布;混合现实插画模型FLUX.1-dev-LoRA;Playground V3生图模型发布
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、全新ComfyUI0.2.0版本重磅来袭,为设计师带来工作流程革命站长网2024-09-05 05:38:360000AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」
声明:本文来自于微信公众号量子位,作者:量子位,授权站长之家转载发布。上市一年后,港股AIGC第一股交出了第一份、也是足够亮眼的一份年终财报。出门问问日前发布2024年度业绩报告,关键数字如下:AIGC业务营收突破2.2亿,同比增长88.5%;全年毛利2亿元,毛利率达52.1%;AIGC注册用户超1000万,付费用户超100万;海外业务收入1.63亿元,占全年总收入的41.8%。0000小米MIX Flip竖向折叠手机正式入网 搭载67W快充技术
站长之家(ChinaZ.com)5月11日消息:近日,一款型号为2405CPX3DC的小米5G数字移动电话机通过了3C认证,这款预测为小米首款竖向折叠手机——MIXFlip。MIXFlip的充电能力十分出色,最高支持67W快充技术,为用户带来高效的充电体验。该手机由北京昌数科技有限公司生产,即小米的自家工厂,保证了其品质和工艺的精良。站长网2024-05-11 11:37:520000星巴克回应推出红烧肉拿铁:受到顾客热烈欢迎
站长之家(ChinaZ.com)2月19日消息:近日,星巴克的一款新品咖啡“年丰咸香拿铁”在社交平台上引发了广泛讨论。这款咖啡的特色在于融合了“东坡红烧肉风味酱和浓缩咖啡”,并加入了蒸煮后的牛奶,最后以东坡红烧肉风味酱和猪肉脯作为装饰,售价为68元。站长网2024-02-19 08:28:160000支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了,开发者狂欢
【新智元导读】国内最大MCP中文社区上线了,支付宝、MiniMax明星服务在魔搭MCP广场独家首发,还有近1500款MCP服务全领域覆盖,再次降低AI开发门槛。MCP玩家,又新增一员!这次还是全开源开放的!今天,中国第一开源社区魔搭ModelScope重磅上线「MCP广场」,国内最大MCP中文社区真的来了。近1500多款热门MCP同时登陆,覆盖了搜索、地图、支付、开发者工具等前沿领域。0000