登陆注册

5两小时暴虐50多名专家

  • Claude 3.5两小时暴虐50多名专家,编程10倍速飙升!但8小时曝出惊人短板

    【新智元导读】AI自主研发会真的「失控」了吗?最新研究显示,Claude3.5Sonnet和o1-preview在2小时内的研发任务中,击败了50多位人类专家。但另一个耐人寻味的现象是,给予更长时间周期后,人类专家在8小时任务中优势显现。AI智能体离自主研发,还有多远?Nature期刊的一篇研究曾证明了,GPT-4能自主设计并开展化学实验,还能阅读文档学习如何使用实验室设备。
    站长网站长资讯2024-11-25 14:28:02
    0000