百度王海峰:文心大模型4.0推理性能提升50倍
站长网2023-10-30 08:30:333阅
在近日的第二十届中国计算机大会上,百度首席技术官王海峰表示,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

王海峰表示,基于更强平台、更优数据、更好算法,我们训练出规模更大、效果更好的文心大模型4.0。通过飞桨与文心的协同优化,模型周均训练有效率超过98%,训练算法效率提升3.6倍,推理性能提升50倍。文心4.0的理解、生成、逻辑、记忆四大能力显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。
公开数据显示,文心一言面向全社会开放一个多月,用户规模达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。飞桨和文心生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。
0003
评论列表
共(0)条相关推荐
Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据
【新智元导读】训练数据的数量和质量,对LLM性能的重要性已经是不言自明的事实。然而,EpochAI近期的一篇论文却给正在疯狂扩展的AI模型们泼了冷水,他们预测,互联网上可用的人类文本数据将在四年后,即2028年耗尽。数据和算力,是AI大模型最重要的两把「铲子」。算力方面,英伟达的不断创新和各家代工厂的产能提高,让世界各处的数据中心拔地而起,研究人员暂时不用担心计算资源。站长网2024-06-16 23:51:110000Meta 推出基于 token 的全新 AI 图像生成模型 CM3leon:更高效先进
Meta正在继续推进对新形式生成式人工智能模型的研究,并公布了最新成果,名为CM3leon(发音类似于「chameleon(变色龙)」)。图片来自MetaCM3leon是一个用于文本到图像创建和图像到文本创建的多模态基础模型,对于自动生成图像标题非常有用。站长网2023-07-18 03:16:570000京东宣布:春晚30亿红包人人有份!
快科技1月30日消息,京东已成为2024年总台春晚独家互动合作平台。京东今天发消息称,除夕看春晚,下载并打开京东APP,1亿份实物好礼一分钱带回家,更有30亿红包人人有份!此外,京东还准备了超多超多、多到购物车装不下的实物好礼,到底都有啥?明天就将陆续揭开面纱!站长网2024-01-30 16:54:130000英国拨款1300万英镑推动医疗领域人工智能的应用
本文要点:1.英国政府拨款1300万英镑支持医疗领域的人工智能研究。2.22个项目将在英国的大学和NHS信托机构中得到资助。3.该资金将用于开发半自主手术机器人和预测健康分析等项目。英国政府已拨款1300万英镑,旨在推进医疗保健领域人工智能(AI)的研究。该资金将支持英国各地大学和NHS信托机构的22个项目,重点范围从用于肿瘤切除的半自主手术机器人到基于现有条件的预测健康分析。站长网2023-08-11 14:32:350000Square Enix 公司总裁宣布在未来游戏中将大力应用人工智能技术
SquareEnix公司总裁TakashiKiryu在其年度「新年信」中宣布,该公司计划在未来游戏的开发和市场营销中大力应用人工智能(AI)技术。这一消息显示出该公司对于新兴技术的重视和未来规划的雄心。0000