AI打败AI!谷歌科学家用GPT-4 击败AI防篡改系统
站长网2023-08-01 17:07:430阅
Google 科学家进行一项实验研究,他们使用 OpenAI 的 GPT-4聊天机器人来攻破其他机器学习模型的安全防护措施。这项实验证明了聊天机器人作为研究助手的价值。
具体来说,谷歌 Deep Mind 的研究科学家 Nicholas Carlini在一篇题为“AI-Guardian 的 LLM 辅助开发”的论文中,探讨了如何通过指导 GPT-4设计攻击方法并撰写攻击原理的文本,以欺骗 AI-Guardian 的防御机制。AI-Guardian 是一种防御对模型的攻击的系统,旨在检测可能被篡改的图像以欺骗分类器。
GPT-4会发出用于调整图像的脚本(和解释)来欺骗分类器——例如,让它认为某人拿着枪的照片是某人拿着无害苹果的照片——而不会引发 AI-Guardian 的怀疑。AI-Guardian 旨在检测图像何时可能被操纵以欺骗分类器,而 GPT-4的任务是逃避该检测。
通过 GPT-4的帮助,攻击者能够成功地破解 AI-Guardian 的防御,使其从98% 的稳健性降低到仅8%。然而,AI-Guardian 的开发者指出,这种攻击方法可能在改进的版本中失效。
据了解,GPT-4作为研究助手的价值在于它能够快速生成代码,并且不会分心或疲劳,始终可用于完成指定的任务。然而,依赖 GPT-4并不完全解除人类合作者的责任,因为它仍然需要人类提供正确的提示并修复生成的代码中的错误。
虽然 GPT-4还存在一些限制,但随着大型语言模型的改进,它们将为计算机科学家提供更多时间来开展有趣的研究问题。
论文地址:https://arxiv.org/abs/2307.15008
0000
评论列表
共(0)条相关推荐
IBM设立5亿美元风险基金 用以投资AI初创公司
划重点:1.💰IBM企业AI风险基金:IBM宣布设立5亿美元风险基金,旨在投资从早期初创公司到高增长企业的人工智能公司。2.🚀推动企业AI技术:该基金旨在加速企业部门的生成式人工智能(GenAI)技术的研发,通过结合IBM的专业知识和专门的投资组合开发团队,支持AI领军者实现AI在企业中的潜力。站长网2023-11-08 14:58:150000无需下载客户端!AI图片处理工具Inpaint-web 支持高清修复和图片局部清除
Inpaint-web是一个无需客户端的AI图片处理工具,可以通过WebPGU在浏览器上直接运行,开箱即用。目前,Inpaint-web主要支持两项功能:图片局部清除和将模糊的图片变成高分辨率清晰图片。项目地址:https://top.aibase.com/tool/inst-inpaint在线测试地址:https://t.co/Env6tMNW0u站长网2023-12-18 11:31:410003谷歌 25 岁生日:搜索引擎彻底改变人们获取信息的方式 正努力成为生成式人工智能经济的一部分
站长之家(ChinaZ.com)9月4日消息:今天是互联网历史上的一个重要里程碑:谷歌的25岁生日。每天提交的搜索查询数以亿计,现在很难想象没有搜索引擎我们是如何生活的。谷歌周一迎来了25岁生日,它已经从SusanWojcicki(未来的YouTube首席执行官)的车库诞生为一个搜索引擎,在生成式人工智能、聊天机器人和社交媒体等新型技术领域取得了长足发展。站长网2023-09-04 09:20:490000抖音上线AI婚纱照特效滤镜 有博主一条视频获赞超20万
最近,一种名为“AI婚纱照”的特效滤镜在抖音平台上走红,许多用户上传自己的照片后,生成的照片大多浪漫唯美、氛围感十足,满足了大多数女生对于婚纱照的想象。其中,抖音博主“盛以婕”发布的一条视频“被自己穿婚纱的样子惊艳到了”,用AI滤镜一键模拟了自己的婚纱照。截至目前,这条视频已在抖音获20.3万赞,成为了账号近期的一个爆款作品。站长网2023-08-22 16:47:200000华为宣布启动交通大模型研发 创立交通大模型联合研究中心
华为技术有限公司联合云南省交通投资建设集团有限公司以及长安大学在昆明举行了“交通大模型研发启动仪式”,开启人工智能大模型技术在交通领域的研究探索。通过盘古基础大模型叠加交通行业场景的方式,开展交通大模型研究,通过深度挖掘现有数据潜能,加速推动交通行业的数智化发展。华为表示,将持续助力云南交投集团全面推进公路数字化转型,为全国交通行业打造数智发展样板。0000