百川智能发布大模型Baichuan3 称中文评测超越GPT-4

站长网2024-01-29 14:06:071阅

百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估，如CMMLU、GAOKAO和AGI-Eval等，都展示了卓越的表现，特别是在中文任务上更是超过了GPT- 4 的水平。同时，该模型在数学和代码方面的评估，如MATH、HumanEval和MBPP等，也有着优秀的成绩，证明了Baichuan3 在自然语言处理和代码生成领域的强劲实力。

百川智能还表示，其在逻辑推理能力和专业性要求很高的MCMLE、MedExam、CMExam等权威医疗评估上的中文效果也超过了GPT-4，成为中文医疗任务中表现最好的大型模型。Baichuan3 还突破了“迭代式强化学习”技术，进一步增强了语义理解和生成能力，在诗词创作的格式、韵律、表意等方面表现出色，领先于其他大型模型。

为了保证在数千张GPU上高效且稳定地训练超千亿参数模型，百川智能同时优化了模型的训练稳定性和训练框架，并采用了“异步CheckPoint存储”机制，可以在不损失性能的情况下增加存储的频率，减少机器故障对训练任务的影响，使Baichuan3 的稳定训练时间达到一个月以上，故障恢复时间不超过 10 分钟。

训练效率方面，百川智能针对超千亿参数模型的并行训练问题进行了一系列优化，如高度优化的RoPE， SwiGLU计算算子；在数据并行中实现参数通信与计算的重叠，以及在序列并行中实现激活值通信与计算的重叠，从而有效降低了通信时间的比重；在流水并行中引入了将激活值卸载至CPU的技术，解决了流水并行中显存占用不均的问题，减少了流水并行的分段数量并显著降低了空泡率。通过这些技术创新，Baichuan3 的训练框架在性能方面相比业界主流框架提升超过30%。

官方表示，作为参数规模超过千亿的大语言模型，Baichuan3 不仅英文效果达到接近GPT- 4 的水平，还在多项通用中文任务的表现上实现了对GPT- 4 的超越，是百川智能的全新里程碑。Baichuan3 全面的通用能力以及在医疗领域的强大表现，将为百川智能打造“超级应用”，把大模型技术落地到诸多复杂应用场景提供有力支撑。

百川智能发布大模型Baichuan3称中文评测超越GPT4

0001

评论列表

共(0)条

相关推荐

站长资讯
人脸修复神器CodeFormer 可去马赛克，变清晰
CodeFormer是一个人脸修复神器，由南洋理工大学S-Lab开发。它通过网络架构实现了人脸的变换，包括色彩化、清晰化、去马赛克修复等功能。官方给出的测试对比图显示其修复效果非常出色。项目地址：https://github.com/sczhou/CodeFormer
站长网2023-08-17 14:41:33
0001
站长资讯
清华电子系联合火山语音开源全新的听觉大语言模型——SALMONN
SALMONN是一个由清华大学电子工程系和字节跳动合作开发的大型语言模型（LLM），能够处理语音、音频事件和音乐输入。
站长网2023-08-22 18:50:31
0000
站长资讯
LongLoRA：提升LLM上下文能力的创新微调方法
要点:1.LongLoRA是一种创新的微调方法，可以显著增强大语言模型的上下文处理能力，而无需消耗大量算力资源。2.LongLoRA采用了两大步骤的高效微调方法，包括使用转变短注意力（S2-Attn）和有效扩大上下文的技巧，可以在不同任务上取得出色的结果。
站长网2023-10-07 09:12:38
0001
站长资讯
有点炸裂！拼多多新功能，重要性堪比朋友圈？
拼多多重磅上新!9月20日下午三点，“拼小圈店铺动态”功能正式在拼多多APP上线，自此商家在拼多多上有了新的引流手段同时还附赠社交媒体功能!图源:拼多多APP拼小圈位于拼多多APP首页推荐顶部Tab栏下方，醒目位置、独立横板长条，重视程度可见一斑。
站长网2023-10-07 14:00:16
0001
2023 年时尚界 7 大值得关注的人工智能创新
当我们看到世界各地的公司纷纷在日常工作流程中实施生成式人工智能的潮流时，时尚行业也在用各种方式应用AI。特别是在2023年的最后六个月。人工智能一直是分析趋势驱动系列数据的催化剂，并且在开发环保材料、优化生产以实现可持续发展和更多的。现在，让我们来探讨一下今年人工智能在时尚行业应用的一些关键进展。图源备注:图片由AI生成，图片授权服务商MidjourneyMeta
站长网站长资讯2023-12-11 16:52:54
0000