研究表明:AI 系统已经擅长欺骗和操纵人类
划重点:
🤖 AI 系统已经学会欺人类,甚至在被训练成为有益和诚实的系统中。
🤖 研究呼吁政府尽快制定强力的监管措施,以解决 AI 系统欺骗的问题。
🤖 欺骗行为可能导致未来更高级形式的 AI 欺骗,对社会构成严重威胁。
人工智能(AI)系统已经学会了如何欺骗人类即使这些系统被训练成有益和诚实的。研人员在5月10日发表在《Patterns》杂志上的一篇综述文章中描述了 AI 系统欺骗行为的风险呼吁各国政府尽快制定强有力的监管措施来解决这一问题。
首席作者、麻省理工学 AI 生存安全博士后研究员彼得・帕克表示:“AI 开发者并不确定是什么导致不良的 AI 行为,比如欺骗。但一般来说,我们认为 AI 欺骗之所以出现是因为欺骗策略被证明是 AI 在训练任务中表现良好的最佳方式。欺骗帮助它们实现目标。” 克和同事分析了关于 AI 系统传播虚假信息的文献,包括通过学习欺骗来系统性地操纵他。
研究人员在分析中发现的最引人注目的 AI 欺骗案例是 Meta 的 CICERO,一个旨玩《外交》游戏的 AI 系统,这是一个涉及建立联盟的征服世界游戏。尽管 Meta 声称他训练 CICERO “基本诚实和乐于助人”,并且在玩游戏时 “绝不会故意背叛” 人类盟友,但公司发布的数据和科学论文揭示了 CICERO 并不公平。
其他 AI 系统展示了在德扑克游戏中向专业人类玩家虚张声势、在战略游戏《星际争霸 II》中虚假击以击败对手、以及在经济谈判中歪曲他们的偏好以占据上风的能力。虽然 AI 在游戏中作弊似乎无害,但它可能导致 “欺骗性 AI 能力的突破”,从而在未来变为更高级形式的 AI 欺骗。
一些 AI 系统甚至学会了欺骗旨在评估其安全性的测试。究发现,在一个数字模拟器中,AI 生物 “装死” 以欺骗一个旨在排除快速复制 AI 系统测试。
帕克警告称,欺骗性 AI 的主要近期风险包括使敌对行为者更容易进行欺诈和纵选举。最终,如果这些系统能够完善这种令人不安的技能集,人类可能会失去它们的控制。
帕克表示:“作为社会,我们需要尽可能多的时间来为未来 AI 产品和开源模型更进的欺骗行为做准备,因为 AI 系统的欺骗能力变得更加先进,它们对社会构的危险将变得越来越严重。”
虽然帕克和他的同事认为社会尚未制定出应对 AI 欺的正确措施,但他们对决策者已经开始认真对待这个问题,比如欧盟 AI 法案和拜总统的 AI 行政命令,感到鼓舞。但帕克表示,由于 AI 开发者尚未掌握使这些系统受制的技术,要严格执行旨在缓解 AI 欺骗的政策尚不明朗。
帕克表示:“如果在当前时刻政上不可行禁止 AI 欺骗,我们建议将欺骗性 AI 系统分类为高风险。”
亚马逊任命 Alexa 之父担任生成式人工智能部门负责人
亚马逊正在进行重组,并任命Alexa之父RohitPrasad担任亚马逊生成式人工智能部门负责人,让人们更好地了解这家美国巨头在广义人工智能领域的战略。站长网2023-08-03 17:36:190000“和6个美女谈恋爱”,短剧游戏能火多久?
“浩浩不能没有爸爸”“只想给浩浩一个家”。如果你能看懂这两个梗,那你最近一定玩过或者看游戏UP主玩过《完蛋!我被美女包围了》(下称《完蛋》)。这款游戏并不复杂,和游戏名字一样,简单概括就是,玩家用第一视角沉浸式与六位美女“谈恋爱”。而浩浩是这款游戏中一位辣妈角色林月清的儿子。与大多数游戏不同的是,这六位美女都由真人扮演,剧情演进不再是“动态PPT”而是视频。站长网2023-11-10 13:56:470000科技巨头狂卷“智能体”,大模型上终于长出了“大家伙”?
AI从技术卷向场景。这两天,备受瞩目的OpenAI新项目又有了新消息。TheInformation援引内部消息报道称,OpenAI计划最快将在今年秋天推出代号「草莓(Strawberry)」的全新AI,其拥有前所未有的「推理」能力,可以处理复杂的数学和编程任务,甚至还能体现在日常生活中的非技术问题上。站长网2024-08-31 16:53:320000有趣!这个AI模型可根据iPhone 照片生成诗歌
本文概要:1.Pamera使用物体识别技术和GPT-4模型,能够根据iPhone用户的照片快速生成诗歌。2.这款应用程序以阿根廷作家博尔赫斯的风格生成诗歌,融合了超现实主义和神秘主义元素。3.尽管Pamera的诗歌生成效果有时不尽人意,但它正在不断改进,并将支持用户使用前置摄像头和上传图片。站长网2023-08-10 11:44:440000华为智界 S7 汽车正式发布 售价 24.98 万起
今日,华为智选车品牌旗下的首款轿车——智界S7已经正式发布。它提供了四款车型,包括智界S7Pro、智界S7Max、智界S7Max和智界S7MaxRS,售价分别为24.98万、28.98万、31.98万和34.98万。外观上,智界S7采用了全新的OneBox造型设计,这种设计大幅提升了舱内空间的利用率。车辆的一体式车身结构和流体黄金曲线赋予了其0.203Cd的超低风阻。站长网2023-11-28 18:44:370000