AI打败AI!谷歌科学家用GPT-4 击败AI防篡改系统
站长网2023-08-01 17:07:430阅
Google 科学家进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。
具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能被操纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据了解,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。
虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
论文地址:https://arxiv.org/abs/2307.15008
0000
评论列表
共(0)条相关推荐
英伟达多元化供应链:人工智能芯片需求激增 部分产品或交由英特尔代工
英特尔有可能成为英伟达未来GPU的制造商。英伟达CEO黄仁勋在Computex的全球媒体圆桌会议的问答环节时表示,公司正在努力多元化其芯片制造,并且最近已经获得了一款基于英特尔下一代工艺节点的测试芯片的良好测试结果。他的这番言论是在多个问题集中讨论英伟达如何确保在人工智能芯片需求激增的情况下供应,并且公司完全依赖位于台积电来制造其最先进的GPU。站长网2023-05-31 09:23:510000英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界
英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世界中用一项项匪夷所思的技术展开了一场革命。2023年,是人工智能爆炸式增长的一年。红色代表人工智能,蓝色代表机器学习微软、谷歌、Meta等科技巨头纷纷回顾了这一年研究成果。英伟达虽以卖算力成为全球GPU霸主,但在AI研究方面也毫不逊色。站长网2023-12-25 17:31:140001百度百家号升级MCN机构合作政策 不达标机构或被清退处置
百度百家号发布关于《百家号MCN机构合作政策》升级的公告称,为了维护百家号平台健康、有序的内容生态,为更多原创作者提供良好的创作环境,自2024年1月8日起,《百家号MCN机构合作政策》(以下简称为“合作政策”)正式升级生效施行。百家号MCN机构准入、入驻后日常运营等各环节考察要求全面升级。0003《只此青绿》高度适配大银幕背后:再论电影宣发的功力与定力
2024电影国庆档拉开大幕后,十部新片里《只此青绿》成为最特别的存在:全程无对白的形式、极为突出的视觉美学、独到的东方文化气韵,让不少观众直呼“文化自信在这一刻具象化了”。0000重掌权杖一周年,奥特曼带着OpenAI大变身
备受瞩目的OpenAI融资,尘埃落定。最终的融资成果是惊人的:融资金额66亿美元,由美国风险投资公司ThriveCapital领投,除了微软继续参投,也有新朋友首次投资,如英伟达和软银集团;融资后估值达到1570亿美元,几乎2倍于今年年初的860亿美元估值,6倍于马斯克的xAI(xAI今年5月B轮融资后估值240亿美元)。融资背后的种种博弈也是颇不寻常的:0000