登陆注册

方法更简单

  • o3并非独门秘技,谷歌已发背后关键机制,方法更简单、成本更低

    o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。当时,来自斯坦福、牛津以及谷歌DeepMind的团队提出通过重复采样来扩展推理计算量——结果在编码任务中将性能最多提高40%。他们发现小模型通过生成多种答案/样本,其任务表现可能比一些大型模型单次尝试还要好。比如,DeepSeek-Coder通过重复采集5个样本,性能优于GPT-4o,而成本却仅为后者的三分之一。
    站长网站长资讯2024-12-24 14:19:47
    0000