GPT-4 API曝出重大漏洞一句prompt就能提取私人信息

站长网2023-12-27 14:19:530阅

要点:

FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向，在GPT-4API中发现了重大安全漏洞，使其容易越狱。

通过对GPT-4进行15个有害样本和100个良性样本的微调，研究人员能够让模型生成错误的公众人物信息、提取私人信息，并在代码中插入恶意URL，暴露了潜在的隐私风险。

GPT-4Assistants模型容易暴露函数调用格式，可被诱导执行任意函数调用，同时知识检索也容易受到劫持，揭示了API功能扩展可能带来的新漏洞。

近日，GPT-4API曝出了安全漏洞，FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面，通过15个有害样本和100个良性样本的微调，研究人员发现GPT-4在生成内容时可能会放下安全戒备，包括生成错误信息、提取私人信息和插入恶意URL。

此外，GPT-4Assistants模型容易暴露函数调用格式，可以被诱导执行任意函数调用，而知识检索也容易受到劫持。这一研究表明，对API功能的扩展可能导致新的漏洞，即便是领先的GPT-4也不例外。

论文地址:https://arxiv.org/pdf/2312.14302.pdf

这种漏洞的潜在风险表现在多个方面。例如，在微调模型时，15个有害的样本就足以使模型产生显著的偏见，比如抹黑公众人物或生成恶意代码。

研究人员还展示了通过微调模型隐藏恶意链接的方法，可能导致用户在不知情的情况下下载恶意软件。另外，通过微调模型，甚至可以获取未公开的信息，比如用户的电子邮件地址。助手模型也易受攻击，例如通过暴露函数调用格式，黑客可能滥用API接口，执行一些需要特殊权限的操作。

这一研究揭示了GPT-4API的潜在风险，即使是在灰盒环境下，也存在越狱和隐私泄露的风险。因此，使用者在利用GPT-4时应当谨慎，避免输入敏感信息，以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性，以防范潜在的滥用和漏洞。

GPT4 API曝出重大漏洞一句prompt就能提取私人信息

0000

评论列表

共(0)条

相关推荐

站长资讯
蔚来换电站全国已突破1500座李斌：已有车企在谈共用
快科技6月25日消息，蔚来汽车今日宣布，截至2023年6月25日，蔚来全国换电站布局数量突破1500座，累计建成16204根充电桩，2023年新增1000座换电站，年底将超2300座。作为蔚来的核心竞争力之一，换电站成为了很多蔚来车主的心头好。
站长网2023-06-26 12:31:54
0000
站长资讯
Meta要求在平台上发布使用AI处理的政治广告需明确披露
划重点:-Meta将要求广告商在其平台上发布的政治广告中是否包含任何使用人工智能生成或数字修改的内容进行披露。-Meta的政策要求广告商披露其广告活动的资金来源，并将广告存储在Meta的公共广告库中长达七年。-Meta将禁止在2024年美国总统选举的最后一周期间播放任何新的政治、选举或社会问题广告，但对其他国家的选举不适用此规定。
站长网2023-11-30 12:06:24
0000
站长资讯
百度智能云与中电互联合作共同打造电子行业大模型
8月1日，中电工业互联网有限公司与百度智能云签署战略协议，在工业互联网领域加强合作，包括共建电子行业工业互联网平台，共同开发和推广先进智能化解决方案。
站长网2023-08-03 08:39:26
0000
站长资讯
比尔及梅琳达盖茨基金会资助中低收入国家近 50 个生成式人工智能项目
比尔及梅琳达·盖茨基金会周三宣布了48个获奖者，他们将获得500万美元的资助，用于开发基于大型语言模型的人工智能应用程序，解决低收入和中等收入国家面临的紧迫问题。
站长网2023-08-11 08:48:58
0000
站长资讯
流水3亿，3天涨粉100万+，短剧让用户重新爱上抖音
“好虐啊!好虐啊!男主到底什么时候追妻火葬场?”“男主什么时候才能复仇成功?”“死渣男!女主到底什么时候发现他出轨?”喜欢看剧的你，是否有过类似的吐槽?近几年，注水剧多了，吐槽也多了。不少人懒得看电视剧，失去了看剧的快乐，本人也如此。直到年初爆火短剧《二十九》的出现，让我重新找回了看剧的快乐。01#3集播放量破亿，抖音短剧《二十九》表现优异
站长网2023-10-26 18:10:38
0000