谷歌“窃取”GPT-3.5模型关键信息:成本低至150元,调用API即可得手
划重点:
🔍 谷歌成功攻击OpenAI GPT-3.5-turbo模型,成本低至150元
🛡️ 攻击方法简单,通过API不到2000次查询即可获取整个投影矩阵和隐藏维度
📢 OpenAI已知情并采取措施修改模型API
谷歌最新研究揭示了一种攻击大型语言模型的方法,成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明,他们不仅还原了OpenAI大模型的整个投影矩阵,还获得了确切的隐藏维度大小,而这一切只需不到2000次巧妙的API查询,成本低至150元。

攻击的核心目标是模型的嵌入投影层,即模型的最后一层,负责将隐藏维度映射到logits向量。通过向模型的API发出针对性查询,可以提取出模型的嵌入维度或者最终权重矩阵。谷歌通过大量查询和奇异值排序成功识别出模型的隐藏维度。
该攻击方法不仅可以揭示模型的隐藏维度,还能获取模型的“宽度”(总体参数量)等全局性信息,降低模型的“黑盒程度”,为后续攻击“铺路”。研究团队表示,这种攻击非常高效,攻击OpenAI的Ada和Babbage模型以及GPT-3.5分别只需不到20美元和大约200美元。
OpenAI已经得知这一情况,并在研究团队征得同意后确认了攻击的有效性,最终删除了所有与攻击相关的数据。虽然这种攻击方式获取的信息并不多,但其低成本和高效性令人震惊。
论文中提到的防御措施包括从API下手,彻底删除logit bias参数,或者直接从模型架构下手,在训练完成后修改最后一层的隐藏维度等。在此事件曝光后,OpenAI已经采取了修改模型API的措施,防止类似攻击再次发生。
这项研究揭示了即使是大型语言模型也可能面临安全威胁,即便OpenAI已经采取了一定的防御措施。这一事件提醒了人们,保障模型的安全性仍然是一个复杂而重要的问题。
论文链接:https://arxiv.org/abs/2403.06634
AI抄袭了我的书,还放在亚马逊上售卖?!
对于每一个文字工作者来说,抄袭或许可以称得上是最令人无法容忍的事情之一了。尤其是对于出书的作家而言。前BBC技术记者RoryCellan-Jones对于自己写的那本回忆录十分上心,“和大多数作家一样,我经常在亚马逊上查看销售情况”。然后这本书就出现了。这天他照常关注着书的销售情况,然后发现在亚马逊搜索出来了Cellan-Jones的传记,封面设计得很幼稚,而作者,他从未听说过这个人。站长网2023-10-10 15:54:200000一个产业带商家在抖音的三次转身
创立于2003年的天使之泪,已经做了20多年的B端生意,它是许多国际奢侈品牌和国内多家珠宝品牌的珍珠源头供应商。产业转型升级的大背景和疫情的冲击,让天使之泪加快了向C端转型的步伐。2020年,天使之泪开始转战抖音电商,依靠CEO直播矩阵店播、头部达人带货以及货架场稳定经营,如今稳坐抖音珍珠类目头部交椅,也成为抖音电商上长起来的代表性产业带品牌商家。0000英特尔第三财季营收 142 亿美元 数据中心和人工智能业务收入 38 亿美元
站长之家(ChinaZ.com)10月27日消息:根据英特尔公司的三季度报告显示,该公司在第三季度实现了142亿美元的营收,同比下降了8%,低于市场预期的135.4亿美元。站长网2023-10-27 15:27:5300002024年微信公开课PRO官宣 微信AI等功能将亮相
2024年微信公开课PRO将于1月11日在广州举行。本次公开课将涵盖多个领域,包括内容创作、开发与行业能力、智慧经营工具、搜索场景打通和连接创造新价值等。其中,短视频专场将讨论推荐、变现和内容运营等问题,带货达人和知识与生活直播标杆也将分享经验。小程序开发能力将有更新,行业头部客户将展示场景化应用。站长网2023-12-25 19:00:210001Google发布增强学习的实验性AI笔记本“NotebookLM”
Google最近在GoogleI/O大会上发布了NotebookLM,这是一个旨在增强学习和洞察力的实验性AI笔记本。NotebookLM是一种独特的笔记本,旨在利用语言模型的能力来提升学习效果。GoogleLabs开发了这个实验性产品,希望重新定义笔记软件,将强大的语言模型融入其中。站长网2023-07-18 17:48:300000