GPT-4 API曝出重大漏洞 一句prompt就能提取私人信息
要点:
FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向,在GPT-4API中发现了重大安全漏洞,使其容易越狱。
通过对GPT-4进行15个有害样本和100个良性样本的微调,研究人员能够让模型生成错误的公众人物信息、提取私人信息,并在代码中插入恶意URL,暴露了潜在的隐私风险。
GPT-4Assistants模型容易暴露函数调用格式,可被诱导执行任意函数调用,同时知识检索也容易受到劫持,揭示了API功能扩展可能带来的新漏洞。
近日,GPT-4API曝出了安全漏洞,FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面,通过15个有害样本和100个良性样本的微调,研究人员发现GPT-4在生成内容时可能会放下安全戒备,包括生成错误信息、提取私人信息和插入恶意URL。
此外,GPT-4Assistants模型容易暴露函数调用格式,可以被诱导执行任意函数调用,而知识检索也容易受到劫持。这一研究表明,对API功能的扩展可能导致新的漏洞,即便是领先的GPT-4也不例外。

论文地址:https://arxiv.org/pdf/2312.14302.pdf
这种漏洞的潜在风险表现在多个方面。例如,在微调模型时,15个有害的样本就足以使模型产生显著的偏见,比如抹黑公众人物或生成恶意代码。
研究人员还展示了通过微调模型隐藏恶意链接的方法,可能导致用户在不知情的情况下下载恶意软件。另外,通过微调模型,甚至可以获取未公开的信息,比如用户的电子邮件地址。助手模型也易受攻击,例如通过暴露函数调用格式,黑客可能滥用API接口,执行一些需要特殊权限的操作。
这一研究揭示了GPT-4API的潜在风险,即使是在灰盒环境下,也存在越狱和隐私泄露的风险。因此,使用者在利用GPT-4时应当谨慎,避免输入敏感信息,以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性,以防范潜在的滥用和漏洞。
ChatGPT 将日本推动人工智能应用的数字部长识别为首相
日本数字化转型大臣表示,ChatGPT未能正确识别他的身份。他在接受彭博电视采访时表示:「我问ChatGPT谁是河野太郎,它给出的答案是错误的,所以你需要小心」。河野太郎是日本数字化转型大臣的名字,他希望自己的名字按日本姓氏排列方式书写。站长网2023-05-15 14:54:390000知网等将共同研发“儿科虚拟患者大模型”产品
12月20日,同方知网(北京)技术有限公司(以下简称同方知网)与首都医科大学附属北京儿童医院(以下简称北京儿童医院)、北京思普科软件股份有限公司(以下简称思普科)签署战略合作协议,三方将就“儿科虚拟患者大模型”开展深入合作。0000研究称 AI、ChatGPT 和社交媒体可能加剧气候危机
划重点:⭐AI和社交媒体可能阻碍气候变化应对努力⭐AI和社交媒体影响人类行为和社会动态⭐使用AI产品和社交媒体需谨慎,注意信息真实性和影响气候行动的潜在影响一项发表在《全球环境政治》期刊上的论坛文章指出,生成式人工智能(AI)包括像OpenAI的ChatGPT这样的大型语言模型,以及社交体可能会削弱应对气候变化的努力。站长网2024-05-11 06:50:550000今日AI:英伟达再出王炸!推最强AI加速卡GB200+机器人模型GR00T;Magnific AI照片风格化功能上线;免费好用的SDXL动漫模型Animagine XL3.1来了
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事英伟达发布最强AI加速卡GB200!单机可训15个GPT-4模型【AiBase提要:】站长网2024-03-19 19:48:120000微博App推出图片机型水印边框功能
近日,有网友发现,微博悄然上线了图片信息边框功能。该功能类似于小米等手机厂商推出的“定制画框”,有需要的用户可以在微博APP“写微博”→“选中图片”→下一步→点击下面的“边框”图标→点击“图片信息”中添加。微博图片边框可以显示手机型号、拍照位置、快门参数、曝光补偿等多种照片信息。有需要的小伙伴可以来试试哦!站长网2023-06-29 19:07:300000