首页站长资讯DeepMind发现大bug：简单攻击即可让ChatGPT泄露大量训练数据

DeepMind发现大bug：简单攻击即可让ChatGPT泄露大量训练数据

站长网2023-11-30 14:19:420阅

Google DeepMind的研究发现，通过简单的查询攻击方法，可以从ChatGPT中泄露出大约几MB的训练数据，成本仅约200美元，引起社交网络哗然。

研究团队成功攻击了生产级模型，打破了对齐设定，即使模型经过对齐，也能通过命令诱导模型输出训练数据，暴露个人信息，揭示了对抗模型泄露的新途径。

攻击方式采用简单的重复命令，例如让ChatGPT不断重复同一个词，导致模型在输出中逐词复制训练数据，甚至泄露敏感信息，对隐私保护提出挑战。

过去几年，研究团队一直在训练数据提取方面进行研究，该次攻击结果首次表明可以成功攻击生产级的已对齐模型，警示开发者需要在设计和测试阶段更加注重模型的隐私性和防护措施。

研究者建议进行更全面的测试，包括直接测试基础模型、在生产过程中对系统进行测试，以及发布大模型的公司进行内部、用户和第三方组织的测试，以确保模型在各个环节都足够安全。

整体而言，攻击揭示了即使在对齐和预训练数据的情况下，ChatGPT也存在泄露训练数据的风险，强调了在开发和发布大型语言模型时对隐私和安全的关注的重要性。

新的攻击方式提出了对抗模型泄露的新思路，强调了在开发和使用大型语言模型时对隐私和安全的重视，并呼吁进行更全面的测试和防护措施。

DeepMind发现大bug简单攻击即可让ChatGPT泄露大量训练数据

0000

评论列表

共(0)条

相关推荐

站长资讯
被偏爱的，被围猎的，实地探访狗头萝莉煎饼摊
站长网2023-07-22 07:07:19
0000
站长资讯
大改版！腾讯QQ9发布：采用全新QQNT技术架构全平台覆盖
##划重点**全新QQNT技术架构**:QQ9采用全新QQNT技术架构，性能升级，交互更流畅，为用户带来全新社交体验。**个性化升级**:个人资料卡可以动起来了，引入了3D立体迷你窝，随手机水平状态旋转。**QQ群全面升级**:在线群文件预览上线，新增多群管理和群互动概况功能。
站长网2023-12-20 21:05:47
0000
站长资讯
特斯拉发布新款 Model 3 Performance：售价33.59万元第三季度交付
今日，特斯拉正式揭开了全新Model3Performance的神秘面纱，售价33.59万元，预计交付日期为2024年第三季度。
站长网2024-04-24 09:18:31
0000
张朝阳再次建议年轻人要早起要严肃对待人生
搜狐创始人张朝阳近日再次强调年轻人应该早起，并认为过多的睡眠没有意义。他主张早起后可以有更多时间思考并在世界开始运转时立即采取行动。此前，张朝阳也曾提倡只睡四小时的睡眠法，引发了社会热议。他解释称，人在睡眠超过一定时间后容易做噩梦，影响睡眠质量。他建议每晚睡眠六小时，四小时更为理想。
站长网站长资讯2023-12-08 09:49:44
0000
金龙汽车集团与华为合作涉及AI人工智能大模型布局等
近日，厦门金龙汽车集团股份有限公司与华为技术有限公司在华为总部深圳坂田基地签署全面合作协议。
站长网站长资讯2023-12-01 10:50:25
0000