谷歌“窃取”GPT-3.5模型关键信息:成本低至150元,调用API即可得手
划重点:
🔍 谷歌成功攻击OpenAI GPT-3.5-turbo模型,成本低至150元
🛡️ 攻击方法简单,通过API不到2000次查询即可获取整个投影矩阵和隐藏维度
📢 OpenAI已知情并采取措施修改模型API
谷歌最新研究揭示了一种攻击大型语言模型的方法,成功窃取了OpenAI GPT-3.5-turbo模型的关键信息。根据谷歌的声明,他们不仅还原了OpenAI大模型的整个投影矩阵,还获得了确切的隐藏维度大小,而这一切只需不到2000次巧妙的API查询,成本低至150元。
攻击的核心目标是模型的嵌入投影层,即模型的最后一层,负责将隐藏维度映射到logits向量。通过向模型的API发出针对性查询,可以提取出模型的嵌入维度或者最终权重矩阵。谷歌通过大量查询和奇异值排序成功识别出模型的隐藏维度。
该攻击方法不仅可以揭示模型的隐藏维度,还能获取模型的“宽度”(总体参数量)等全局性信息,降低模型的“黑盒程度”,为后续攻击“铺路”。研究团队表示,这种攻击非常高效,攻击OpenAI的Ada和Babbage模型以及GPT-3.5分别只需不到20美元和大约200美元。
OpenAI已经得知这一情况,并在研究团队征得同意后确认了攻击的有效性,最终删除了所有与攻击相关的数据。虽然这种攻击方式获取的信息并不多,但其低成本和高效性令人震惊。
论文中提到的防御措施包括从API下手,彻底删除logit bias参数,或者直接从模型架构下手,在训练完成后修改最后一层的隐藏维度等。在此事件曝光后,OpenAI已经采取了修改模型API的措施,防止类似攻击再次发生。
这项研究揭示了即使是大型语言模型也可能面临安全威胁,即便OpenAI已经采取了一定的防御措施。这一事件提醒了人们,保障模型的安全性仍然是一个复杂而重要的问题。
论文链接:https://arxiv.org/abs/2403.06634
音乐制作 AI 应用 Riffusion 融资 400 万美元
近日,音乐创业公司Riffusion最近完成了一轮融资,获得了400万美元资金,用于进一步开发其人工智能技术,可以生成原创音乐。本轮融资由GreycroftPartners领投,SouthParkCommons和Sky9也参与其中。站长网2023-10-18 21:43:370000度小满“轩辕70B”金融大模型开源
度小满推出全新的金融行业大模型“轩辕70B”,标志着金融大模型迈向新的高度。该模型在通用能力和专业金融领域表现出色,名列各项开源模型评测榜单前列,特别在中文任务评测和金融领域十大类权威考试方面提供专业支持。站长网2023-09-25 14:43:100000GPT-4V新玩法登顶GitHub热榜,随手一画就能生成网页,web开发者:感受到了威胁
随手一画就能生成网页!GPT-4V新玩法登顶GitHub热榜,狂揽3000🌟:现在只要简单画一画,框一框,点击执行:“啪”地一下,一个带有各种“按钮”的网页就做好了:对应代码也一览无余:整个操作过程十分快捷简单。新玩法不只在GitHub上火,开发者SawyerHood把demo展示po到𝕏上,也迅速走红,点赞转发收藏2700:站长网2023-11-18 13:48:020000小米回应SU7翼子板脱落:仅个例 均经历过高速涉水
今日晚间,小米汽车对近期网络上关于小米SU7翼子板脱落的反馈进行了回应。小米汽车经核实后发现,仅有个别车辆出现了翼子板脱落的问题,而这些车辆都有一个共同点,即曾经历过高速涉水的行驶工况。站长网2024-04-25 18:19:250000LVMH创始人身价跌至全球第三 马斯克再次成世界首富
快科技10月18日消息,据报道,随着奢侈品股票近日遭遇抛售,LV老板伯纳德?阿尔诺失去了全球第二富豪的头衔,目前他拥有的财富已经低于亚马逊创始人杰夫?贝佐斯。法国奢侈品巨头LVMH创始人兼CEO贝尔纳阿尔诺,失去了世界第二大富豪的宝座,回到了富豪排行榜第三。当地时间17日周二,根据彭博亿万富翁指数,阿尔诺目前净资产为1550亿美元,低于亚马逊创始人贝佐斯的1560亿美元。0000