GPT-4 API曝出重大漏洞一句prompt就能提取私人信息

站长网2023-12-27 14:19:530阅

要点:

FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向，在GPT-4API中发现了重大安全漏洞，使其容易越狱。

通过对GPT-4进行15个有害样本和100个良性样本的微调，研究人员能够让模型生成错误的公众人物信息、提取私人信息，并在代码中插入恶意URL，暴露了潜在的隐私风险。

GPT-4Assistants模型容易暴露函数调用格式，可被诱导执行任意函数调用，同时知识检索也容易受到劫持，揭示了API功能扩展可能带来的新漏洞。

近日，GPT-4API曝出了安全漏洞，FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面，通过15个有害样本和100个良性样本的微调，研究人员发现GPT-4在生成内容时可能会放下安全戒备，包括生成错误信息、提取私人信息和插入恶意URL。

此外，GPT-4Assistants模型容易暴露函数调用格式，可以被诱导执行任意函数调用，而知识检索也容易受到劫持。这一研究表明，对API功能的扩展可能导致新的漏洞，即便是领先的GPT-4也不例外。

论文地址:https://arxiv.org/pdf/2312.14302.pdf

这种漏洞的潜在风险表现在多个方面。例如，在微调模型时，15个有害的样本就足以使模型产生显著的偏见，比如抹黑公众人物或生成恶意代码。

研究人员还展示了通过微调模型隐藏恶意链接的方法，可能导致用户在不知情的情况下下载恶意软件。另外，通过微调模型，甚至可以获取未公开的信息，比如用户的电子邮件地址。助手模型也易受攻击，例如通过暴露函数调用格式，黑客可能滥用API接口，执行一些需要特殊权限的操作。

这一研究揭示了GPT-4API的潜在风险，即使是在灰盒环境下，也存在越狱和隐私泄露的风险。因此，使用者在利用GPT-4时应当谨慎，避免输入敏感信息，以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性，以防范潜在的滥用和漏洞。

GPT4 API曝出重大漏洞一句prompt就能提取私人信息

0000

评论列表

共(0)条

相关推荐

站长资讯
奢望AI写作文？先把校对干好再说
连高考作文都能写，面对更简单的校对工作，AI大模型能做好吗?高考开始后，除了考生之外，最忙碌的可能就是AI大模型们了，有人测试它写高考作文，有人测试它解数学应用，各家AI大模型，这几天很忙。十项全能的AI大模型，连高考考场都敢上，对于相对简单的校对工作，是不是更不在话下?对此，不同的使用人群，有着不一样的反馈。
站长网2023-06-10 08:59:50
0000
站长资讯
今日AI：苹果大模型MM1入场；Sora训练数据来源竟来自这；全球最快AI芯片WSE-3发布；阿里邀请AI参加数学竞赛
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/📰🤖📢AI新鲜事苹果大模型MM1入场:参数达到300亿超半数作者是华人【AiBase提要:】
站长网2024-03-15 16:12:18
0000
站长资讯
微软NaturalSpeech语音合成推出第三代生成语音更自然了
要点:微软NaturalSpeech推出第三代语音合成技术，实现了超自然的零样本语音合成。NaturalSpeech3采用创新的属性分解扩散模型和数据/模型扩展，提高了语音合成的质量和自然度。FACodec和属性分解扩散模型是NaturalSpeech3的关键技术，取得了SOTA的语音合成效果。
站长网2024-03-23 03:46:46
0000
站长资讯
AI制作高质量超萌猫片，Pika Labs一句话就能生成
文章概要:1.PikaLabs可快速生成高质量视频2.用户只需输入文字提示即可制作视频3.PikaLabs搭载在Discord上，需要官方批准才能使用PikaLabs是一款强大的文本转视频AI平台，能快速生成高质量的视频作品。用户只需输入一个文字提示，PikaLabs就能生成剧情连贯、画面精美的视频。
站长网2023-08-29 17:27:34
0000
站长资讯
文旅AIGC产品开发商“九号诶艾科技”获300万元种子轮融资
近日，初创公司“九号诶艾科技”宣布获得“海南康氏实业投资集团”的种子轮融资，旨在加速AIGC垂直产业的布局。据介绍，九号诶艾科技公司于2023年成立，团队专注于基于ChatGPT类大模型与prompt交互的AIGC文旅产品，深入文旅大场景进行应用落地，为用户提供智能旅行策划与本地生活推荐的“吃喝玩乐出游”智能个人秘书。
站长网2023-07-24 18:14:43
0002