登陆注册

Anthropic惊人发现

  • 大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

    【新智元导读】最近,大模型训练遭恶意攻击事件已经刷屏了。就在刚刚,Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力,他们发现:模型遇到危险任务时会隐藏真实能力,还会在代码库中巧妙地插入bug,躲过LLM和人类「检查官」的追踪!就在昨天,某大厂模型训练遭入侵的事件,惊动了整个AI圈。上图已针对敏感信息进行编辑据悉,疑似有人对某大厂的集群代码持续发起恶意攻击,包括但不限于:
    站长网站长资讯2024-10-20 09:38:55
    0000