万卡训练史上最大参数模型!百度文心大模型4.0最快下周见
站长网2023-10-09 15:37:380阅
快科技10月9日消息,日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。
消息称,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。
根据我们获得的最新消息,上述消息基本属实。目前了解到,文心大模型4.0实际上已经在小流量测试。
根据我们拿到的消息,文心大模型4.0的参数规模要大于目前所有公开发布参数的LLM,也是国内首次使用万卡集群训练的大模型。这意味着文心大模型4.0的参数规模预计能突破万亿级别。
万卡集群什么概念?国内之前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推出的具体模型。万卡集群就不容易建了,如果用起来发挥最大化作用则更难了。
据分析,正是因为飞桨的深度联合,才能高效地基于万卡集群训练起如此规模的模型。
不仅训练成本在增加,文心4.0的推理成本比3.5增加很多,我们还没拿到具体每千token的推理成本,但据传大概是此前的8-10倍,这还是在高利用率(MFU)的情况下。如果利用率更低,估计成本还会继续增加。
不得不说,大模型真的很费钱。可见,打造领先的底层基础打模型,就是一场巨头的游戏。
根据IDC发布的首个大模型评估报告《AI大模型技术能力评估报告,2023》,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,综合能力在众多国产大模型中遥遥领先。
经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后者的表现,我们拭目以待。
0000
评论列表
共(0)条相关推荐
问界新M7大定破6万,余承东称“起死回生,真不容易”
站长之家(ChinaZ.com)10月15日消息:日前,问界AITO官方许纳布,其下全新M7上市首月累计大定已经突破6万台。问界新M7再次创下惊人的销售成绩,首月大定数量已经超过6万台,这一消息让华为车BU董事长余承东深感振奋。不禁在朋友圈里发出感叹:“起死回生,真不容易”。这一壮丽的业绩不仅仅是庆祝新车上市的胜利,更代表了对华为智选车业务的强大信心。站长网2023-10-15 10:11:420000To C大模型,亏钱也得干
大模型的两条落地方向,虽南辕北辙但境遇相似。被寄予商业化落地厚望的是确定性较强的toB方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。而此前尚属于测试阶段的toC方向自不必说,无论是产品形态的成熟度还是用户心智深度都还不足以支撑商业化,这也是业内将聚光灯自最初的C端向B端转移的原因。站长网2023-10-06 09:36:310000刘作虎:友商应该庆幸 一加还没做2000元以下手机
快科技12月4日消息,今晚举办的一加十周年围炉夜话”活动中称,刘作虎发话:友商应该庆幸一加没有做2000元以下的产品。他补充道:未来一加不排除会做2000以下的产品,如果大家需要的话。笔者查阅发现,目前一加(OPPO)商城在售的一加手机只有一款低于2000元,它就是一加Ace竞速版,最低到手价1399元。站长网2023-12-04 22:04:210000李若彤领衔3大明星!《剑侠世界3》年度版9月7日公测
最新消息:西山居新一代剑侠情缘手游《剑侠世界3》今日官宣李若彤代言,年度版将于9月7日8:00正式公测。江湖挚友吕颂贤、李国麟降临剑侠江湖,助力新门派峨眉上线。当三大武侠明星与剑侠IP联手,将会碰撞出什么样的火花呢?峨眉现身江湖,十三大门派齐聚,却遭遇西域神秘番僧踢馆,峨眉掌门李若彤是否能携手各大门派侠客力挽狂澜?且看《剑侠世界3》年度版“峨眉争锋”大片预告。站长网2023-09-01 10:43:200000AI 视频编辑器Dumme:几分钟就能将YouTube长视频变成短视频
Dumme是一家由YCombinator支持的初创公司,该公司一直在利用AI将较长的YouTube视频转换为较短的视频。该公司有数百名视频创作者在测试其产品,还有20,000多个预发布候补名单。站长网2023-06-05 19:28:230000