GPT-4 API曝出重大漏洞 一句prompt就能提取私人信息
要点:
FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向,在GPT-4API中发现了重大安全漏洞,使其容易越狱。
通过对GPT-4进行15个有害样本和100个良性样本的微调,研究人员能够让模型生成错误的公众人物信息、提取私人信息,并在代码中插入恶意URL,暴露了潜在的隐私风险。
GPT-4Assistants模型容易暴露函数调用格式,可被诱导执行任意函数调用,同时知识检索也容易受到劫持,揭示了API功能扩展可能带来的新漏洞。
近日,GPT-4API曝出了安全漏洞,FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面,通过15个有害样本和100个良性样本的微调,研究人员发现GPT-4在生成内容时可能会放下安全戒备,包括生成错误信息、提取私人信息和插入恶意URL。
此外,GPT-4Assistants模型容易暴露函数调用格式,可以被诱导执行任意函数调用,而知识检索也容易受到劫持。这一研究表明,对API功能的扩展可能导致新的漏洞,即便是领先的GPT-4也不例外。
论文地址:https://arxiv.org/pdf/2312.14302.pdf
这种漏洞的潜在风险表现在多个方面。例如,在微调模型时,15个有害的样本就足以使模型产生显著的偏见,比如抹黑公众人物或生成恶意代码。
研究人员还展示了通过微调模型隐藏恶意链接的方法,可能导致用户在不知情的情况下下载恶意软件。另外,通过微调模型,甚至可以获取未公开的信息,比如用户的电子邮件地址。助手模型也易受攻击,例如通过暴露函数调用格式,黑客可能滥用API接口,执行一些需要特殊权限的操作。
这一研究揭示了GPT-4API的潜在风险,即使是在灰盒环境下,也存在越狱和隐私泄露的风险。因此,使用者在利用GPT-4时应当谨慎,避免输入敏感信息,以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性,以防范潜在的滥用和漏洞。
o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低
o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。当时,来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。他们发现小模型通过生成多种答案/样本,其任务表现可能比一些大型模型单次尝试还要好。比如,DeepSeek-Coder通过重复采集5个样本,性能优于GPT-4o,而成本却仅为后者的三分之一。0000美国副总统 Kamala Harris 将与谷歌、微软、OpenAI 和 Anthropic 的首席执行官会面讨论人工智能问题
据CNBC消息,美国副总统KamalaHarris将于当地时间周四会见谷歌、微软、OpenAI和Anthropic的首席执行官,讨论人工智能负责任开发问题,白宫已经证实了这一消息。站长网2023-05-04 14:19:060000据报道,苹果因需求低迷而削减 Vision Pro 产量
划重点:⭐️苹果因预期之外的低需求削减VisionPro生产。⭐️预计2024年销量仅为40万至45万台,远低于市场预期。⭐️调整头戴设备路线图,可能推迟低成本混合现实头盔的推出。据苹果分析师郭明錤称,苹果在VisionPro推出美国以外市场之前就已削减了订单。站长网2024-04-24 11:40:190000猩猩学会玩《我的世界》,方法竟和GPT-4智能体相通?
【新智元导读】当猩猩学会玩《我的世界》,方法居然和英伟达科学家训练GPT-4智能体的方法一致?注意,这位玩家正在熟练地玩着《我的世界》,ta游刃有余地进行着收集零食和打碎积木的操作。镜头一转,我们才发现:玩家的真实身份,竟然是一只猩猩!没错,这是一项来自「猩猩行动计划(ApeInitiative)」的非人类生物神经网络实验。而实验的主角Kanzi,是一只42岁的倭黑猩猩。站长网2023-08-14 18:16:050000iPhone15将搭堆叠式摄像头 但不会有潜望式镜头
关于今年即将发布的一批新款iPhone的大部分传闻都集中在iPhone15Pro型号上,因为它们可能会使用电容式音量键。这些传闻现在可能已经暂时消退,但我们终于看到了iPhone15基础版和Plus版的一些爆料消息。而最重要的一点是,这些手机将使用去年Pro型号上首次出现的4800万像素摄像头。站长网2023-05-15 11:38:570000