GPT-4 API曝出重大漏洞 一句prompt就能提取私人信息
要点:
FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向,在GPT-4API中发现了重大安全漏洞,使其容易越狱。
通过对GPT-4进行15个有害样本和100个良性样本的微调,研究人员能够让模型生成错误的公众人物信息、提取私人信息,并在代码中插入恶意URL,暴露了潜在的隐私风险。
GPT-4Assistants模型容易暴露函数调用格式,可被诱导执行任意函数调用,同时知识检索也容易受到劫持,揭示了API功能扩展可能带来的新漏洞。
近日,GPT-4API曝出了安全漏洞,FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面,通过15个有害样本和100个良性样本的微调,研究人员发现GPT-4在生成内容时可能会放下安全戒备,包括生成错误信息、提取私人信息和插入恶意URL。
此外,GPT-4Assistants模型容易暴露函数调用格式,可以被诱导执行任意函数调用,而知识检索也容易受到劫持。这一研究表明,对API功能的扩展可能导致新的漏洞,即便是领先的GPT-4也不例外。
论文地址:https://arxiv.org/pdf/2312.14302.pdf
这种漏洞的潜在风险表现在多个方面。例如,在微调模型时,15个有害的样本就足以使模型产生显著的偏见,比如抹黑公众人物或生成恶意代码。
研究人员还展示了通过微调模型隐藏恶意链接的方法,可能导致用户在不知情的情况下下载恶意软件。另外,通过微调模型,甚至可以获取未公开的信息,比如用户的电子邮件地址。助手模型也易受攻击,例如通过暴露函数调用格式,黑客可能滥用API接口,执行一些需要特殊权限的操作。
这一研究揭示了GPT-4API的潜在风险,即使是在灰盒环境下,也存在越狱和隐私泄露的风险。因此,使用者在利用GPT-4时应当谨慎,避免输入敏感信息,以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性,以防范潜在的滥用和漏洞。
陈香贵开始猛扑抖音同城
抖音同城在今年已经成为餐饮界热议的话题。而去年抖音的同城生活部门还在小步摸索,今年就异军突起,甚至打破了传统同城“人货场”模式,开创了一条全新的内容型同城电商新赛道。背后的逻辑是,传统本地生活电商平台,如阿里、美团和大众点评,流量主要局限在周围3公里范围内。抖音则利用内容的先天优势,将广告型内容巧妙融入用户时间,通过创意而有趣的内容激发用户兴趣,再通过优惠券进行转化交易。站长网2023-08-26 17:25:460000张兰直播间爆红一年后,麻六记“起飞”了吗?
张兰直播间爆红一年后,麻六记被曝出或将赴港上市的传闻。去年11月,张兰在儿子汪小菲和女星大S离婚事件闹得沸沸扬扬时,在抖音高调直播带货,一度成为直播届“顶流”,创下3天卖货近5000万元的战绩,其中卖得最火爆的产品,当属自家品牌麻六记的酸辣粉。站长网2023-11-26 13:25:070000消息称中国移动将发布“九天”1+N大模型
据新浪科技报道,中国移动即将发布名为“九天”的1N大模型,并计划将其应用于政务和客服两个主要的场景。目前,九天人工智能平台的技术团队拥有超过600名研发人员。据中国移动相关人士透露,他们即将推出的基于大模型的产品技术将主要面向G端用户进行布局。同时,他们将优先考虑在政府和客服这两个场景中进行落地。对于其他领域的行业大模型,中国移动将主要通过与合作伙伴进行协同推进。站长网2023-07-08 02:52:430001人工智能繁荣可能导致新的 GPU 短缺 但英伟达表示目前只是存在封装问题
加密货币繁荣的导致2020年和2021年期间PC显卡价格大幅上涨,而价格至今仍达不到许多普通用户所希望的那样。当前的人工智能热潮可能会产生类似的效果,一些公司报告称出现供应短缺,但是英伟达表示供应链比许多人想象的更加复杂。站长网2023-08-07 08:56:590000微博将推出 AIGC 创作助手:辅助大 V 进行内容创作
在日前的微博超级红人节上,微博宣布计划推出AIGC创作助手,帮助创作者提高内容质量和效率。微博将于二季度,针对历史累计原创博文大于5000条的创作者开放100个优先体验席位。此外,2023年微博将全面升级金V运营体系,将金V衡量标准从原来的流量考核,调整到「流量社交」的衡量,并升级对接服务能力,投入价值10亿元人民币的运营资源扶持金V群体扩大影响力。站长网2023-04-16 15:27:170001