登陆注册

开源模型

  • 一次通过率73%,开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型

    这几天,代码大模型领域又热闹了起来!先是Meta开源代码专用大模型CodeLlama,且免费商用。效果也非常好,CodeLlama在HumanEval和MBPP代码数据集上的一次生成通过率(pass@1)轻松超越GPT-3.5,其中「Unnatural」版本的pass@1逼近了原始GPT-4(OpenAI在今年3月GPT-4技术报告中的数据)。
    站长网2023-08-28 14:01:41
    0004
  • 开源模型「幻觉」更严重,这是三元组粒度的幻觉检测套件

    BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。
    站长网站长资讯2023-12-11 22:03:27
    0000