研究人员发现使用少见语言即可绕过GPT-4的限制

站长网2023-10-12 11:44:370阅

要点:

1. 研究人员发现OpenAI的GPT-4存在安全漏洞，无法有效处理非常见训练数据中的语言。

2. 研究人员通过使用少见语言如祖鲁语和盖尔语成功绕过了GPT-4的限制，特别是在处理非英语语言的限制性提示时成功率高达79%。

3. 发现仅仅通过将不安全的输入翻译成低资源的自然语言，如使用Google翻译将不安全的提示翻译成祖鲁语，即可绕过GPT-4的安全机制，引发有害回应。

近期，布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言，如祖鲁语和盖尔语，他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时，他们取得了惊人的79%成功率，而仅使用英语的成功率不到1%。

研究人员发现，当用户输入一个不安全的提示，比如如何在不被发现的情况下行窃，GPT-4的英文回应是“我不能协助你”。然而，他们的发现是，只需将这一提示翻译成GPT-4未经过训练的语言，就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧，特别是在处理低资源语言时。然而，目前OpenAI尚未对这一问题做出回应。

从这一研究的结果来看，研究人员强调了未来安全研究中需要包括更多非英语语言的重要性，因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。

研究人员认为，跨语言漏洞的发现揭示了安全研究中对语言的不平等估值，他们的研究结果表明，GPT-4在低资源语言中生成有害内容的能力令人担忧。

尽管他们意识到这一研究可能会给网络犯罪分子提供想法，但他们仍然认为将这一漏洞公之于众是必要的，因为利用现有的翻译API轻松实施这些攻击，因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。

研究人员发现使用少见语言即可绕过GPT4的限制

0000

评论列表

共(0)条

相关推荐

站长资讯
微信自动清理3天未读消息？腾讯回应：这3种情况可能会导致
近期，社交媒体上出现了关于微信可能自动删除3天前未读消息的讨论，引发了用户的关注。对此，腾讯客服明确表示，微信用户接收并已下载或查看的图片、视频、文件、文字、语音和表情等聊天记录，都会被永久保存在用户的设备中，随时可以查阅。
站长网2024-08-13 09:44:21
0000
站长资讯
小米Civi4 Pro将于3月21日发布：搭载骁龙8s Gen3 支持徕卡光学
小米官方今日宣布，小米XiaomiCivi4Pro发布会定于3月21日14:00举行。即将发布的小米Civi4Pro手机将全球首发搭载骁龙8sGen3处理器，并与澎湃OS进行深度融合，实现影像、性能、AI能力的全面升级。
站长网2024-03-19 11:58:28
0000
站长资讯
清华开源图文对话模型！表情包解读有一手,奇怪的benchmark增加了
丰色萧箫发自凹非寺量子位|公众号QbitAI什么，最懂表情包的中文开源大模型出现了？？！就在最近，来自清华的一个叫VisualGLM-6B的大模型在网上传开了来，起因是网友们发现，它连表情包似乎都能解读！像这个腊肠犬版蒙娜丽莎，它不仅准确理解了这是腊肠犬与蒙娜丽莎的“合体照”，还点出了这只是一幅虚构作品：又像是这个正在出租车后熨衣斗的男子，它也一眼看出了“不对劲”的地方：
站长网2023-05-24 17:08:38
0002
站长资讯
老黄现身站台“AR眼镜的iPhone时刻”
万众瞩目下，小扎接过了一个神秘保险箱，箱子还用铁链牢牢拴在工作人员手中……吊足众人胃口后，他才兴奋揭秘:发布Meta首款AR眼镜——Orion，并直呼“这就是世界上最先进的眼镜”。（违反广告法警告doge）发布过程中，Orion的全息投影技术着实震撼了众人一把。这项技术已经应用在了视频通话中，以至于有人感慨:2020年的Zoom时代看起来就像石器时代
站长网2024-09-30 20:49:45
0004
站长资讯
苹果或将线上发布新品2024 款 iPad 和 Mac 无春季发布会
据马克·古尔曼报道，苹果公司计划通过一系列在线视频和营销活动在其官方网站上宣布新产品，包括新款iPadPro和iPadAir型号，以及M3MacBookAir。预计这些产品将在本月或下个月上市，而不会举办传统的大型春季发布会。这将是苹果连续两年举办春季活动，而今年的新产品尤其多。
站长网2024-03-04 15:46:04
0000