登陆注册

等LLM的自动越狱攻击

  • 研究发现针对ChatGPT、Bard 等LLM的自动越狱攻击

    研究人员发现,可以自动构建对抗性攻击,欺骗ChatGPT、Bard和Claude等主要语言模型(LLM),以提供非预期且可能有害的内容传统的越狱需要大量手动开发,通常可以由LLM供应商解决。然而,这些自动化攻击可以大量创建,并且可以在闭源和公开的聊天机器人上运行。
    站长网2023-07-31 10:44:46
    0001