百度王海峰:文心大模型4.0推理性能提升50倍
站长网2023-10-30 08:30:333阅
在近日的第二十届中国计算机大会上,百度首席技术官王海峰表示,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
王海峰表示,基于更强平台、更优数据、更好算法,我们训练出规模更大、效果更好的文心大模型4.0。通过飞桨与文心的协同优化,模型周均训练有效率超过98%,训练算法效率提升3.6倍,推理性能提升50倍。文心4.0的理解、生成、逻辑、记忆四大能力显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。
公开数据显示,文心一言面向全社会开放一个多月,用户规模达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。飞桨和文心生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。
0003
评论列表
共(0)条相关推荐
小米13 Ultra发布:徕卡四摄六焦段覆盖 5999元起
小米今晚在京召开新品发布会,发布会上小米发布了新款小米13Ultra手机,搭载由小米和徕卡联合研发的新一代Summicron镜头,5999元起售。小米13Ultra其背面设计看起来非常像相机,尤其是徕卡M系列。这款手机还采用了独特的绒面皮革拼接设计和弧形过渡方案,与相机类似。徕卡品牌大使、著名街拍摄影师MattStuart表示,小米13Ultra是专业影像设备,不是一台拍照手机。站长网2023-04-18 20:41:290000AI 原生时代,字节想要复刻第三次增长奇迹
2024年被业内称为「AI应用元年」,字节跳动布局AI的节奏明显加快了。过去一年,字节推出十余款AI应用,覆盖Agent定制、聊天、社交、图像/视频、办公、教育等多个领域,甚至还涉足了硬件产品。移动互联网时代,字节就有「APP工厂」之称,所以相继打造今日头条和抖音两个爆款产品,借此成为最赚钱的中国互联网公司之一。图源备注:图片由AI生成,图片授权服务商Midjourney0000参数小,性能强!开源多模态模型—TinyGPT-V
安徽工程大学、南洋理工大学和理海大学的研究人员开源了多模态大模型——TinyGPT-V。TinyGPT-V以微软开源的Phi-2作为基础大语言模型,同时使用了视觉模型EVA实现多模态能力。尽管TinyGPT-V只有28亿参数,但其性能可以媲美上百亿参数的模型。此外,TinyGPT-V训练只需要24GGPU就能完成,不需要A100、H100那些高端显卡来训练。0000面壁智能联合清华发布大模型智能体GitAgent
面壁智能联合清华大学自然语言处理实验室发布了GitAgent,这是一种可以自主扩展工具箱的大模型智能体应用框架。通过GitAgent,大模型智能体可以从GitHub上扩展工具集合,以应对复杂任务需求。站长网2024-01-15 11:42:550000GitHub发布Copilot Workspace 开发者第二大脑来袭
要点:1、CopilotWorkspace可以帮助开发者完成更大、更复杂的任务。2、CopilotWorkspace侧重于任务选择、意图表达和与AI合作寻求解决方案。3、GitHub结合AI智能体技术和GitHubCodespaces实现无头、短暂、安全的计算方式。站长网2023-11-09 14:06:520000