谷歌“窃取”GPT-3.5模型关键信息:成本低至150元，调用API即可得手

站长网2024-03-12 14:21:220阅

划重点:

🔍 谷歌成功攻击OpenAI GPT-3.5-turbo模型，成本低至150元

🛡️ 攻击方法简单，通过API不到2000次查询即可获取整个投影矩阵和隐藏维度

📢 OpenAI已知情并采取措施修改模型API

谷歌最新研究揭示了一种攻击大型语言模型的方法，成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明，他们不仅还原了OpenAI大模型的整个投影矩阵，还获得了确切的隐藏维度大小，而这一切只需不到2000次巧妙的API查询，成本低至150元。

攻击的核心目标是模型的嵌入投影层，即模型的最后一层，负责将隐藏维度映射到logits向量。通过向模型的API发出针对性查询，可以提取出模型的嵌入维度或者最终权重矩阵。谷歌通过大量查询和奇异值排序成功识别出模型的隐藏维度。

该攻击方法不仅可以揭示模型的隐藏维度，还能获取模型的“宽度”（总体参数量）等全局性信息，降低模型的“黑盒程度”，为后续攻击“铺路”。研究团队表示，这种攻击非常高效，攻击OpenAI的Ada和Babbage模型以及GPT-3.5分别只需不到20美元和大约200美元。

OpenAI已经得知这一情况，并在研究团队征得同意后确认了攻击的有效性，最终删除了所有与攻击相关的数据。虽然这种攻击方式获取的信息并不多，但其低成本和高效性令人震惊。

论文中提到的防御措施包括从API下手，彻底删除logit bias参数，或者直接从模型架构下手，在训练完成后修改最后一层的隐藏维度等。在此事件曝光后，OpenAI已经采取了修改模型API的措施，防止类似攻击再次发生。

这项研究揭示了即使是大型语言模型也可能面临安全威胁，即便OpenAI已经采取了一定的防御措施。这一事件提醒了人们，保障模型的安全性仍然是一个复杂而重要的问题。

论文链接:https://arxiv.org/abs/2403.06634

谷歌窃取 GPT3 5模型关键信息成本低至150元调用API即可得手

0000

评论列表

共(0)条

相关推荐

站长资讯
Vectara排行榜:OpenAI的GPT-4在文档摘要中幻觉率最低
**划重点:**1.📊Vectara的排行榜显示，OpenAI的GPT-4在文档摘要中具有最低的幻觉率，准确率为97%。2.🚀GPT-4和GPT-4Turbo表现最佳，GPT-3.5Turbo排名第二，MetaLlama为最高得分的非OpenAI模型，而GooglePalm排名最后。
站长网2023-11-22 10:44:14
0000
站长资讯
抖音电商将搜索运营全新升级上线“搜索诊断”功能
抖音电商将搜索运营全新升级，上线“搜索诊断”功能，新增商机补品、站内外营销&种草和搜索广告，旨在以营销、新品、付费三大引擎带动品牌搜索运营效率;同时为品牌提供成熟的搜索增长路径指引，助力广大品牌看清搜索机会、找准运营方法、开辟增长路径。官方数据显示，抖音电商搜索日均用户超1亿;搜索成交GMV年同比增长159%，平均转化率对比其他站内渠道高30%。
站长网2023-07-16 18:48:54
0000
站长资讯
加入腾讯云TDSQL(PostgreSQL版) TCP课程，开启数据库学习新征程
腾讯云TDSQL(PostgreSQL版)‍TCP
站长网2023-05-24 15:53:48
0000
站长资讯
小米申请“汽车超级工厂”“泰坦合金”等商标
小米科技有限责任公司近日在多个领域申请注册了中英文商标，其中包括“小米泰坦”、“小米泰坦合金”、“小米超级电机”、“小米汽车超级工厂”和“小米EV超级工厂”等。这些商标的注册申请涵盖了运输工具、金属材料和建筑修理等领域，但目前商标状态为等待实质审查。据悉，小米已建成并投产了9100吨大压铸工厂，拥有整套压铸岛流水线，60台设备，并自研了大压铸材料，即小米泰坦合金。
站长网2024-01-15 16:04:51
0001
站长资讯
消息称苹果正招募新软件工程师涉及生成式 AI 等领域
据报道，苹果正在积极招聘新的软件工程师，要求其在生成式AI和混合现实领域都有一定经验。在近期更新的招聘页面中，苹果明确要求招聘熟悉“对话和生成式AI”开发的人员，并表示将借助生成式AI的力量，加速为头戴设备创建AR/VR应用程序。据了解，在苹果之前已有87个职位与“人工智能”有关，其中超过1/3是在本月新设的，其中48个是在2023年3月新设的，其中超过一半是新开发的职位。
站长网2023-06-03 10:46:23
0000