万卡训练史上最大参数模型!百度文心大模型4.0最快下周见
站长网2023-10-09 15:37:380阅
快科技10月9日消息,日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。
消息称,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。
根据我们获得的最新消息,上述消息基本属实。目前了解到,文心大模型4.0实际上已经在小流量测试。
根据我们拿到的消息,文心大模型4.0的参数规模要大于目前所有公开发布参数的LLM,也是国内首次使用万卡集群训练的大模型。这意味着文心大模型4.0的参数规模预计能突破万亿级别。
万卡集群什么概念?国内之前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推出的具体模型。万卡集群就不容易建了,如果用起来发挥最大化作用则更难了。
据分析,正是因为飞桨的深度联合,才能高效地基于万卡集群训练起如此规模的模型。
不仅训练成本在增加,文心4.0的推理成本比3.5增加很多,我们还没拿到具体每千token的推理成本,但据传大概是此前的8-10倍,这还是在高利用率(MFU)的情况下。如果利用率更低,估计成本还会继续增加。
不得不说,大模型真的很费钱。可见,打造领先的底层基础打模型,就是一场巨头的游戏。
根据IDC发布的首个大模型评估报告《AI大模型技术能力评估报告,2023》,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,综合能力在众多国产大模型中遥遥领先。
经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后者的表现,我们拭目以待。
0000
评论列表
共(0)条相关推荐
高通将与恩智浦、博世等多家公司联合开发开源RISC-V架构
8月5日消息,据外媒报道,根据一份声明,在高通首席执行官(CEO)克里斯蒂亚诺·阿蒙(CristianoAmon)的领导下,高通将与恩智浦、北欧半导体公司(NordicSemiconductor)、英飞凌和博世合作,开发和推广用于芯片设计的开源RISC-V架构。站长网2023-08-05 19:35:240000希捷放弃开发60TB固态硬盘!将主要精力放在机械硬盘上
快科技2月12日消息,希捷在2016年的FlashMemorySummit闪存峰会上,曾展出过一款容量高达60TB的固态硬盘。这款硬盘搭载了来自美光的3D闪存,采用双端口SAS-3规格,顺序读写可达1500MB/s,随机读取可达150KIOPS。功耗也不算高,最大活动功耗仅需要15W。8年过去了,这款固态硬盘至今都没有没有推出。希捷近日公开表示,谈及了取消60TB固态硬盘的原因。0000VIFA将于8月17日发布全球首款ChatGPT音箱“ChatMini”
智度股份宣布,全球首个内置ChatGPT智能音箱VifaChatMini将于8月17日发布,售价为259美元。该智能音箱具有更小的体积和更强的便利性,并且内置了ChatGPT和百度文心一言双AI,可以进行更丰富的对话,包括创作诗歌、提供安慰等。站长网2023-08-11 15:13:050000开源项目Open Interpreter:让AI在操作系统中自我复制
近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目OpenInterpreter,AI实现了在操作系统级别启动自身副本的雏形。这一创新基于多模态大模型,通过截图分析屏幕内容,生成操作计划,并调用系统接口执行任务。这不仅是对任务执行能力的拓展,更是AI自我复制的一次重要尝试。项目地址:https://top.aibase.com/tool/open-interpreter站长网2024-01-16 14:31:400000工资到账:小米汽车员工实发工资曝光 年入百万不是梦
快科技6月15日消息,近日,有网友曝光了小米汽车员工实发工资,年入百万不是梦。从网友曝光的图片看,有小米汽车员工晒出的是发工资每月在5.5W-7.2W不等,而年收入是78W不高不低。不过从岗位和工资匹配度来看,这应该是小米汽车高级技术员工。之前有国内媒体报道称,小米汽车正在紧急招工人,月薪最高1万元。站长网2024-06-16 03:19:430000