登陆注册

1也傻了

  • 大模型智障检测+1:Strawberry有几个r纷纷数不清,最新最强Llama3.1也傻了

    继分不清9.11和9.9哪个大以后,大模型又“集体失智”了!数不对单词“Strawberry”中有几个“r”,再次引起一片讨论。GPT-4o不仅错了还很自信。刚出炉的Llama-3.1405B,倒是能在验证中发现问题并改正。比较离谱的是Claude3.5Sonnet,还越改越错了。说起来这并不是最新发现的问题,只是最近新模型接连发布,非常热闹。
    站长网2024-07-25 18:25:32
    0000