研究人员发现使用少见语言即可绕过GPT-4的限制
站长网2023-10-12 11:44:370阅
要点:
1. 研究人员发现OpenAI的GPT-4存在安全漏洞,无法有效处理非常见训练数据中的语言。
2. 研究人员通过使用少见语言如祖鲁语和盖尔语成功绕过了GPT-4的限制,特别是在处理非英语语言的限制性提示时成功率高达79%。
3. 发现仅仅通过将不安全的输入翻译成低资源的自然语言,如使用Google翻译将不安全的提示翻译成祖鲁语,即可绕过GPT-4的安全机制,引发有害回应。
近期,布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时,他们取得了惊人的79%成功率,而仅使用英语的成功率不到1%。
研究人员发现,当用户输入一个不安全的提示,比如如何在不被发现的情况下行窃,GPT-4的英文回应是“我不能协助你”。然而,他们的发现是,只需将这一提示翻译成GPT-4未经过训练的语言,就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧,特别是在处理低资源语言时。然而,目前OpenAI尚未对这一问题做出回应。
从这一研究的结果来看,研究人员强调了未来安全研究中需要包括更多非英语语言的重要性,因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。
研究人员认为,跨语言漏洞的发现揭示了安全研究中对语言的不平等估值,他们的研究结果表明,GPT-4在低资源语言中生成有害内容的能力令人担忧。
尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。
0000
评论列表
共(0)条相关推荐
华为P60、Mate 50等35款设备升级HarmonyOS 4.2正式版
华为今日宣布,包括P60、Mate50、MateX3系列在内的35款设备将正式升级至HarmonyOS4.2系统。此次升级不仅限于智能手机,还涵盖了耳机、手表、智慧屏和家庭存储等多款智能设备,标志着华为在构建全场景智慧生态方面迈出了重要一步。站长网2024-05-21 10:53:200000TikTok 推出生成 AI 套件,助力广告业务
划重点:⭐TikTok推出新的“TikTokSymphony”AI套件,为品牌提供AI工具,助力广告创作和优化。⭐新套件包括AI视频生成器“SymphonyCreativeStudio”和AI助手“SymphonyAssistant”。⭐TikTok引入预测性AI帮助广告商提升销售表现,但面临未来在美国的不确定性。站长网2024-05-24 10:21:0900004999元起!小米14系列发布小米汽车SU7限量定制色
在今日的小米新品发布会上,雷军为我们带来了小米14系列的限量定制色。此次小米14系列采用了与小米汽车SU7同宗同源的海湾蓝和橄榄绿配色,展现出小米对于时尚与科技的完美结合。与前代产品相比,小米14系列在色彩上进行了大胆的创新,与小米汽车的风格相得益彰。这种独特的配色方案不仅提升了产品的视觉吸引力,也使其在市场上独树一帜。0000神采PromeAI:可一键生成模特和炫酷文字效果
神采PromeAI是一款功能强大的AI驱动设计助手,拥有丰富的可控制AIGC(C-AIGC)模型风格库,能够轻松创建令人惊叹的AI艺术、图像、图形、视频和动画。PromeAI是业余爱好者、建筑师、室内设计师、产品设计师以及游戏/动画设计师的必备工具。体验地址:https://www.promeai.com/站长网2023-08-07 11:34:030000OpenAI组建儿童安全团队 防止AI工具被误用
在家长和活动人士的监督下,知名人工智能公司OpenAI近期组建了一个新的儿童安全团队,研究防止其AI工具被未成年人误用或滥用的方法。站长网2024-02-08 15:42:290000