登陆注册

研究人员发布了针对ChatGPT和其他LLM的攻击算法

  • 研究人员发布了针对ChatGPT和其他LLM的攻击算法

    卡内基梅隆大学(CMU)的研究人员发表了LLMAttacks,这是一种用于构建针对各种大型语言模型(LLM)的对抗攻击的算法,包括ChatGPT、Claude和Bard。这些攻击是自动生成的,对GPT-3.5和GPT-4的成功率为84%,对PaLM-2的成功率为66%。
    站长网2023-08-07 09:01:48
    0000