登陆注册

蚂蚁集团发布DevOps领域大模型评测基准DevOps

  • 蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval

    蚂蚁集团联合北京大学发布了面向DevOps领域的大语言模型评测基准——DevOps-Eval。该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。此外,还针对AIOps任务做了细分,并添加了日志解析、时序异常检测、时序分类和根因分析等任务。
    站长网2023-11-02 15:31:59
    0000