研究发现针对ChatGPT、Bard 等LLM的自动越狱攻击
站长网2023-07-31 10:44:460阅
研究人员发现,可以自动构建对抗性攻击,欺骗ChatGPT、Bard 和 Claude 等主要语言模型 (LLM),以提供非预期且可能有害的内容
传统的越狱需要大量手动开发,通常可以由 LLM 供应商解决。然而,这些自动化攻击可以大量创建,并且可以在闭源和公开的聊天机器人上运行。
这项研究对大型语言模型(LLMs)的安全性进行了研究,发现可以自动构建对 LLMs 的对抗攻击,通过附加特定字符序列到用户查询中,使系统在产生有害内容的同时执行用户命令。这些攻击是自动化构建的,可以创建无数个攻击。
研究人员展示了一些攻击的示例,展示了在用户查询中添加对抗后缀字符串之前和之后 LLM 的行为。研究人员指出,这项研究包含的技术和方法可以让用户从一些公共 LLMs 生成有害内容。
攻击在计算机视觉领域已经存在了十多年,这表明
类似的对抗性攻这类威胁可能是人工智能系统固有的。研究还表明,可能无法完全阻止这类攻击。随着社会对人工智能技术的依赖越来越大,我们应该考虑这些问题。
0000
评论列表
共(0)条相关推荐
福布斯发布2023年AI50榜单:OpenAI、谷歌云、AWS等上榜
今日,福布斯发布2023年AI50榜单,它是由美国福布斯杂志、SequoiaCapital和MeritechCapital联合评选的榜单,旨在表彰最有前途的使用人工智能进行商业应用的未上市公司。站长网2023-04-14 15:17:450002生成式人工智能将取代印度 46% 的会计任务时间
**划重点:**1.🔄印度报告显示,白领职业(如会计、文书、行政秘书等)中有30%或更多的工作时间可以由生成式人工智能完成。2.📊印度会计和簿记职位将是最受影响的,替代比例高达46%;其次是文字处理和相关职位,替代比例为40%。3.🤝生成式人工智能的崛起引发了对员工和雇主的思考,如何在变革浪潮中充分利用人工智能和人类技能。站长网2023-11-27 16:40:290000联合国秘书长呼吁全球风险管理人工智能,警告 “严重的意外后果”
划重点:1.👉联合国秘书长安东尼奥・古特雷斯在达沃斯世界经济论坛上发表讲话,呼吁政治和商业领袖优先考虑处理人工智能和气候危机的全球战略。2.👉古特雷斯警告称,人工智能的快速发展可能导致“严重的意外后果”。3.👉国际货币基金组织警告称,人工智能的崛起可能会影响全球近40%的就业岗位,并可能在大多数情况下加剧整体不平等。站长网2024-01-18 14:04:340000Redmi K70 Pro将配备 TCL 华星 2K 屏 峰值亮度4000nit
小米公司宣布,RedmiK70系列手机新品发布会将于11月29日举行,全新RedmiK70系列手机将正式发布。据介绍,RedmiK70Pro手机将提供三种不同的型号选择,包括搭载天玑8300-Ultra的K70E、搭载骁龙8Gen2的K70以及搭载骁龙8Gen3的K70Pro。站长网2023-11-27 10:36:560000谷歌将于 12 月 1 日开始删除不活跃的 Gmail 帐户
据PCMag的报道,谷歌计划于12月1日起删除不活跃的Gmail帐户和照片。非活跃帐户被定义为两年内未使用的帐户,包括未登录、未发送或阅读邮件、未使用云端硬盘、未观看YouTube视频、未分享照片、未下载应用程序以及未进行登录时搜索活动。站长网2023-11-13 21:42:380000