登陆注册

微软华人团队发布全新基准AGIEva

  • 微软华人团队发布全新基准AGIEva AI考公指日可待

    微软研究人员发布了一个新的基准测试AGIEval,用于评估基础模型在人类认知任务中的表现,包括高考、公务员考试、法学院入学考试、数学竞赛和律师资格考试等。实验结果显示,GPT-4在一些任务中的表现超过了人类平均水平,但在需要复杂推理或特定领域知识的任务中不太熟练。论文链接:https://arxiv.org/pdf/2304.06364.pdf
    站长网2023-05-11 10:50:20
    0000