登陆注册

可评估文本生成模型性能

  • 智谱AI发布评分模型CritiqueLLM 可评估文本生成模型性能

    近日,智谱AI发布了高质量、低成本的评分模型CritiqueLLM,用于评估文本生成模型的性能。传统的评价指标如BLEU和ROUGE主要基于n-gram重合度来计算评分,缺乏对整体语义的把握。而基于模型的评价方法则对基座模型的选取非常依赖,只有顶级的大模型才能取得令人满意的效果。
    站长网2023-12-12 14:41:50
    0001