谷歌“窃取”GPT-3.5模型关键信息:成本低至150元,调用API即可得手
划重点:
🔍 谷歌成功攻击OpenAI GPT-3.5-turbo模型,成本低至150元
🛡️ 攻击方法简单,通过API不到2000次查询即可获取整个投影矩阵和隐藏维度
📢 OpenAI已知情并采取措施修改模型API
谷歌最新研究揭示了一种攻击大型语言模型的方法,成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明,他们不仅还原了OpenAI大模型的整个投影矩阵,还获得了确切的隐藏维度大小,而这一切只需不到2000次巧妙的API查询,成本低至150元。
攻击的核心目标是模型的嵌入投影层,即模型的最后一层,负责将隐藏维度映射到logits向量。通过向模型的API发出针对性查询,可以提取出模型的嵌入维度或者最终权重矩阵。谷歌通过大量查询和奇异值排序成功识别出模型的隐藏维度。
该攻击方法不仅可以揭示模型的隐藏维度,还能获取模型的“宽度”(总体参数量)等全局性信息,降低模型的“黑盒程度”,为后续攻击“铺路”。研究团队表示,这种攻击非常高效,攻击OpenAI的Ada和Babbage模型以及GPT-3.5分别只需不到20美元和大约200美元。
OpenAI已经得知这一情况,并在研究团队征得同意后确认了攻击的有效性,最终删除了所有与攻击相关的数据。虽然这种攻击方式获取的信息并不多,但其低成本和高效性令人震惊。
论文中提到的防御措施包括从API下手,彻底删除logit bias参数,或者直接从模型架构下手,在训练完成后修改最后一层的隐藏维度等。在此事件曝光后,OpenAI已经采取了修改模型API的措施,防止类似攻击再次发生。
这项研究揭示了即使是大型语言模型也可能面临安全威胁,即便OpenAI已经采取了一定的防御措施。这一事件提醒了人们,保障模型的安全性仍然是一个复杂而重要的问题。
论文链接:https://arxiv.org/abs/2403.06634
《抓娃娃》火了,沈腾马丽拯救暑期档
“电影院好久没这么热闹了,《抓娃娃》来了才意味着暑期档刚开始。”位于北五环某影院的一位工作人员感慨。自从今年端午档迎来了近十年最差票房后,影院的日子一直不太好过,直到上周末(7月13日)沈腾马丽主演的喜剧《抓娃娃》开启点映,暑期档才热闹起来,“观众是以往周六日的好几倍。”这位工作人员表示。0000AI+游戏,迎来Sora时刻?来听听从业者们怎么说
8小时销量破百万,5天吸金1.89亿美元,上线一个月Steam和Xbox玩家数量超2500万……2024年开年以来,游戏圈的最大黑马非《幻兽帕鲁》莫属。这款“缝合”了《宝可梦》《塞尔达》《方舟:生存进化》等个游戏的玩法,自1月19日发售以来,销量与讨论度一路攀升。同时,对于《幻兽帕鲁》的成功,AI可能帮了大忙的猜测,也实实在在地给从业者们打了一剂肾上腺素。站长网2024-03-12 09:07:590000国家邮政局:“双11”当天全国快递业务量达6.39亿件
国家邮政局监测数据显示,2023年11月1日至11日,全国邮政快递企业共揽收快递包裹52.64亿件,同比增长23.22%,日均业务量是平日业务量的1.4倍。其中11月11日当天,共揽收快递包裹6.39亿件,是平日业务量的1.87倍,同比增长15.76%。站长网2023-11-13 17:20:320000强大人工智能编码助手code AI 自动分析代码结构并优化
codeAI是一款强大的人工智能编码助手,旨在提供便捷高效的编码体验。它结合了先进的机器学习技术和丰富的编程知识,为开发人员提供了全面的编码支持和智能建议。通过深度学习算法,codeAI能够自动分析代码结构,并识别出潜在的错误和优化机会。它能够快速定位问题,并提供实时的修复建议,从而大大提高代码质量和开发效率。站长网2024-01-08 15:41:010001期待已久的双指互点来了 苹果发布watchOS 10.1第二个测试版本
快科技10月5日消息,苹果手表上的双指互点功能在发布之后就一直备受期待,目前这一功能终于在watchOS10.1公开测试版中出现。苹果最近向开发者发布了第二个watchOS10.1测试版更新,增加了AppleWatchSeries9和AppleWatchUltra2的双指互点两下功能,这也是这两款手表的主要新功能。0000