百川智能发布大模型Baichuan3 称中文评测超越GPT-4
百川智能于 1 月 29 日推出了拥有超过千亿参数的大型语言模型Baichuan 3。该模型在多个公认的通用能力评估,如CMMLU、GAOKAO和AGI-Eval等,都展示了卓越的表现,特别是在中文任务上更是超过了GPT- 4 的水平。同时,该模型在数学和代码方面的评估,如MATH、HumanEval和MBPP等,也有着优秀的成绩,证明了Baichuan3 在自然语言处理和代码生成领域的强劲实力。
百川智能还表示,其在逻辑推理能力和专业性要求很高的MCMLE、MedExam、CMExam等权威医疗评估上的中文效果也超过了GPT-4,成为中文医疗任务中表现最好的大型模型。Baichuan3 还突破了“迭代式强化学习”技术,进一步增强了语义理解和生成能力,在诗词创作的格式、韵律、表意等方面表现出色,领先于其他大型模型。
为了保证在数千张GPU上高效且稳定地训练超千亿参数模型,百川智能同时优化了模型的训练稳定性和训练框架,并采用了“异步CheckPoint存储”机制,可以在不损失性能的情况下增加存储的频率,减少机器故障对训练任务的影响,使Baichuan3 的稳定训练时间达到一个月以上,故障恢复时间不超过 10 分钟。
训练效率方面,百川智能针对超千亿参数模型的并行训练问题进行了一系列优化,如高度优化的RoPE, SwiGLU计算算子;在数据并行中实现参数通信与计算的重叠,以及在序列并行中实现激活值通信与计算的重叠,从而有效降低了通信时间的比重;在流水并行中引入了将激活值卸载至CPU的技术,解决了流水并行中显存占用不均的问题,减少了流水并行的分段数量并显著降低了空泡率。通过这些技术创新,Baichuan3 的训练框架在性能方面相比业界主流框架提升超过30%。
官方表示,作为参数规模超过千亿的大语言模型,Baichuan3 不仅英文效果达到接近GPT- 4 的水平,还在多项通用中文任务的表现上实现了对GPT- 4 的超越,是百川智能的全新里程碑。Baichuan3 全面的通用能力以及在医疗领域的强大表现,将为百川智能打造“超级应用”,把大模型技术落地到诸多复杂应用场景提供有力支撑。
荣耀申请MagicGPT商标
据天眼查App显示,近日,荣耀终端有限公司申请“MagicGPT”商标,国际分类为网站服务、科学仪器,当前商标状态均为申请中。不久前,该公司已申请科学仪器类“MagicAI”商标,当前商标状态也为申请中。今年6月,荣耀CEO赵明表示,消费电子行业的最大影响因素,不是经济周期,而是创新周期。AI和5G等技术开启了新一轮创新周期,为智能手机的发展打开全新的机会大门。站长网2023-09-04 14:44:070000OpenText发布首套Aviator AI功能——Cloud Edition 23.4
要点:1.OpenText发布了CloudEdition23.4,首次引入AviatorAI功能,包括大型语言模型(LLM)以提高效率、生产力和用户体验。2.企业认识到人工智能技术的威力,OpenText将AI技术整合到其信息管理解决方案,以满足不断增长的市场需求。站长网2023-10-12 10:28:350000iOS 18 公测版发布,教你如何安装 iOS 18公开测试版
iOS18和iPadOS18的公测版终于发布了,喜欢尝鲜的朋友们可以免费下载试用啦!虽然公测版可能会有一些小问题,但如果你想先体验最新的iPhone功能,这绝对是个不错的机会。站长网2024-07-16 10:05:500000360智脑大模型应用发布会定档6月13日
日前,360官微发布消息,360智脑大模型应用发布会将于6月13日14时在北京召开。据介绍,360智脑”为360自研千亿参数大语言模型,今年4月,“360智脑”结合360搜索、智能硬件等场景的落地应用已陆续成熟,并开放内测。此前,周鸿祎曾展示了“360智脑”,360智脑具备强大的理解力和推理力,可以回答天津经济社会发展方面的问题。站长网2023-06-05 19:58:270002颠覆性设计!苹果新专利曝光:实现iPhone正面反向无线充电
快科技10月11日消息,现在的电子行业,产品越出越多,功能也是越来越多。但是不管哪种电子产品,使用的时候都要考虑到续航问题。许多手机厂商也考虑到了这个问题,并且给手机增加了反向无线充电的功能。这样在手表、耳机等电池较小的产品没电时,可以通过这个功能来应急。站长网2023-10-11 20:22:300000