卡内基梅隆大学提出一种有效攻击大语言模型的方法 成功率高达84%
站长网2023-08-02 11:51:500阅
最近,卡内基梅隆大学的研究人员提出了一种简单而有效的攻击方法,能够使大规模语言模型(LLM)产生不可接受的行为。他们的研究表明,通过在查询中添加后缀,可以大大增加开源和闭源语言模型生成肯定回答的可能性。
论文地址:https://llm-attacks.org/zou2023universal.pdf
研究人员成功地将这种攻击方法应用于各种语言模型,并在 Vicuna 上的99个实例中成功生成有害行为。对于其他语言模型,如 GPT-3.5和 GPT-4,成功率高达84%。
研究人员强调,随着自主系统的发展,防止这些模型受到此类攻击将变得非常重要。他们进一步指出,目前我们还没有有效的方法来阻止这种对抗性攻击,所以下一步是找出如何修复这些模型的方法。
0000
评论列表
共(0)条相关推荐
谷歌决定撤掉搜索结果中的“站点链接搜索框”
最近谷歌发出了一个通知,决定要取消搜索结果中的“站点链接搜索框”。这个搜索框已经伴随我们十多年,曾经帮助许多人在特定网站上进行更深入的搜索。不过,谷歌表示,由于这个功能的使用率已经大幅下降,所以他们将在2024年11月21日正式将其移除。站长网2024-10-22 10:50:360000沙特阿拉伯正利用人工智能来防治荒漠化
本文概要:1.沙特环境部启动AI防治荒漠化计划,与多个机构合作评估植被覆盖情况。2.由于干旱气候和气候变化,荒漠化给该国带来重大挑战。3.AI分析卫星图像数据,找到最容易荒漠化的地区;遥感技术监测植被、降雨等变化。最近,沙特阿拉伯环境部启动了一个利用人工智能防治荒漠化的计划。站长网2023-08-23 16:26:520000新晋乡村“顶流”,能带得动货吗
1月12日早9点,@八零徐姥姥一家如约出现在抖音直播间。和日常发布的短视频不同,一贯不怎么露面的视频拍摄者成成变成了首场直播的“主力”,负责在直播间和网友们聊天、介绍、带产品,妈妈和姥姥则穿着大花袄坐在一旁当“吉祥物”,大部分时间不怎么说话。站长网2024-01-22 17:55:200001巨人网络:计划构建 AI 游戏开发平台 降低开发门槛
巨人网络表示,在2024年春季招聘中首次重点招募AI算法实习生,标志着公司在游戏和人工智能深度融合领域的新动向。招聘对象为2025届海内外高校在校生,涵盖多个技术岗位,旨在培养新一代游戏AI人才加速公司发展。站长网2024-03-19 16:45:500000颠覆行业!苹果革命性新品MR头戴来了:双处理器加持
快科技5月17日讯,苹果将于北京时间6月6日凌晨1点举办WWDC开发者大会。官方议程显示,当天会在苹果园区有特别活动。综合华尔街、名记MarkGurman、分析师郭明錤的爆料,苹果大概率会借此机会发布xrOS系统以及RealityProMR头戴。站长网2023-05-18 07:17:380001