注册

开源模型

首页标签开源模型

站长资讯
一次通过率73％，开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型
这几天，代码大模型领域又热闹了起来!先是Meta开源代码专用大模型CodeLlama，且免费商用。效果也非常好，CodeLlama在HumanEval和MBPP代码数据集上的一次生成通过率（pass@1）轻松超越GPT-3.5，其中「Unnatural」版本的pass@1逼近了原始GPT-4(OpenAI在今年3月GPT-4技术报告中的数据)。
站长网2023-08-28 14:01:41
0004
这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct
在最近关于「ScalingLaw是否撞墙」的讨论中，后训练（post-training）被寄予厚望。
站长网站长资讯2024-11-26 09:15:19
0000
开源模型「幻觉」更严重，这是三元组粒度的幻觉检测套件
BSChecker:细粒度大模型幻觉检测工具与基准测试排行榜大模型长期以来一直存在一个致命的问题，即生成幻觉。由于数据集的复杂性，难免会包含过时和错误的信息，这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见，这也算是一种形式的幻觉。如何检测和有效缓解大模型的生成幻觉问题一直是学术界的热门课题。
站长网站长资讯2023-12-11 22:03:27
0000

热点

《封神2》崩的越惨，DeepSeek的刀就越锋利。
2025-02-06 18:40:06
iPhone用户警惕！苹果App Store首次发现OCR恶意软件：悄无声息窃取资料
2025-02-07 03:21:16
一周打赏20万，各个品牌为做“榜一大哥”正在疯狂撒钱。
2025-02-06 18:38:10
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
过年三件套平替爆火：商家月入200万，订单“根本发不完”
2025-02-06 01:10:59
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11
一个行业的AI样板：教培的不同环节怎么被改写
2025-02-05 23:37:52
这个春节大家都在看什么？哪吒创影史纪录，DeepSeek刷屏全网
2025-02-07 02:48:00
黄仁勋喊话年轻人：学会用AI 才能更出色
2025-02-05 23:36:32
告别5美元包邮，Temu和Shein还是比亚马逊便宜
2025-02-07 02:47:51

关注

小鹏G9/G6正式登陆爱尔兰/芬兰：加速欧洲市场布局
2025-02-04 09:36:20
《哪吒2》登顶，谁赚麻了？
2025-02-07 15:41:39
小米汽车门店已有216家门店：覆盖全国64城
2025-02-04 09:33:18
雷军去小米汽车工厂上班了：确认要进一步提产冲击年销30万辆
2025-02-07 15:06:26
三星Exynos 2500芯片确认于2025年下半年推出：性能不及骁龙8 Elite
2025-02-04 07:34:04
小米眼镜官博上线旗下首款AI眼镜将发布
2025-02-07 10:20:34
DeepSeek创始人老家成热门打卡地：家长带着孩子拍照打卡
2025-02-04 07:31:46
模型优惠进入倒计时 DeepSeek因服务器暂停API服务充值
2025-02-07 03:18:38
硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了
2025-02-02 16:49:29
小米眼镜官微上线：智能眼镜赛道要爆发
2025-02-07 02:59:11

推荐