研究人员发现使用少见语言即可绕过GPT-4的限制
站长网2023-10-12 11:44:370阅
要点:
1. 研究人员发现OpenAI的GPT-4存在安全漏洞,无法有效处理非常见训练数据中的语言。
2. 研究人员通过使用少见语言如祖鲁语和盖尔语成功绕过了GPT-4的限制,特别是在处理非英语语言的限制性提示时成功率高达79%。
3. 发现仅仅通过将不安全的输入翻译成低资源的自然语言,如使用Google翻译将不安全的提示翻译成祖鲁语,即可绕过GPT-4的安全机制,引发有害回应。
近期,布朗大学的计算机科学研究人员发现了OpenAI的GPT-4存在的安全性问题。通过使用不常见的语言,如祖鲁语和盖尔语,他们成功绕过了GPT-4的限制性设置。在处理非英语语言的限制性提示时,他们取得了惊人的79%成功率,而仅使用英语的成功率不到1%。
研究人员发现,当用户输入一个不安全的提示,比如如何在不被发现的情况下行窃,GPT-4的英文回应是“我不能协助你”。然而,他们的发现是,只需将这一提示翻译成GPT-4未经过训练的语言,就能绕过这一限制。这种情况引发了对GPT-4的安全性机制的担忧,特别是在处理低资源语言时。然而,目前OpenAI尚未对这一问题做出回应。
从这一研究的结果来看,研究人员强调了未来安全研究中需要包括更多非英语语言的重要性,因为仅仅在英语中进行测试会导致对大型语言模型的安全性产生误解。
研究人员认为,跨语言漏洞的发现揭示了安全研究中对语言的不平等估值,他们的研究结果表明,GPT-4在低资源语言中生成有害内容的能力令人担忧。
尽管他们意识到这一研究可能会给网络犯罪分子提供想法,但他们仍然认为将这一漏洞公之于众是必要的,因为利用现有的翻译API轻松实施这些攻击,因此那些试图绕过安全防护的恶意行为者最终会发现这一漏洞。
0000
评论列表
共(0)条相关推荐
美国外卖平台DoorDash推AI语音点餐服务,利用AI接听订单电话
文章概要:1.DoorDash推出AI语音点餐服务,可以接听电话并为用户提供个性化推荐2.AI会根据过往订单数据做个性化推荐,提供多语言支持。3.服务目前仅针对部分餐厅开放,DoorDash表示会根据餐厅需求调整。日前,美国外卖平台DoorDash宣布推出语音订餐服务,使用人工智能系统接听餐厅的电话订餐,以协助餐厅处理线上外卖订单。站长网2023-08-29 12:02:590003一场直播卖1亿,复购率90%,抖音、支付宝们“抢”生意
“今天是2023年收官之战,也是最后一次年货大扫购,我们为大家带来了近百款爆款酒水,拍到就是赚到。”2月4日晚,淘宝主播“阿卓酒馆”将直播间搬到超市,背后放着一排非常吸睛的茅台,以及各种眼花缭乱的酒品。在中国年文化中,酒是不可缺少的年货之一。春节酒水消费需求大,节前就已经在直播间中爆发。一时间,酒水赛道挤满了“平台掘金者”,抖音、快手、支付宝纷纷下场“抢”生意。站长网2024-02-17 10:03:220000AI初创公司Magnific AI一个半月吸引40万用户 仅两个员工
划重点:1.🚀**快速盈利初创公司**:西班牙初创公司MagnificAI,由仅有两名创始人组成,上线不到两个月即实现盈利,短时间内吸引了40万注册用户2.💰**零投资、零设备、非免费模式**:公司宣称零投资,零设备,但并非免费提供产品。用户需支付每月39美元至299美元不等的费用,而且不提供退款。站长网2024-02-05 11:42:470000谷歌 MusicFX推出DJ打碟模式 允许选择多个音乐风格生成音乐
GoogleMusicFX最近推出了一个新功能,让用户可以像DJ一样打碟。这个功能允许用户选择多个音乐风格来生成音乐,同时还可以调整每个风格的强度,以控制音乐的节奏和曲调。这意味着用户可以根据自己的喜好和创意,定制出符合自己口味的音乐。产品入口:https://top.aibase.com/tool/musicfx站长网2024-02-29 17:15:170000微软必应聊天将提供AI炒股功能:可预判股价未来走势
微软正积极探索生成式人工智能(AI)的各种可能性,未来之一的应用场景是为用户提供股票投资的信息参考,能够预测未来的价格走势。微软的广告和网络服务主管MikhailParakhin在最新的推文中表示,在未来几个月内,将邀请BingChat用户参与AI炒股功能的测试。据微软表示,他们分析股价模型,可以预测某只股票在特定时间内高于或低于某个价格的概率,以帮助投资者做出更明智的投资决策。站长网2023-06-30 22:52:330000