ChatGLM2-6B 发布 相比初代推理提速42%
GLM技术团队宣布升级ChatGLM-6B,并发布了ChatGLM2-6B。之前发布的ChatGLM-6B在3月14日上线,截至6月24日,其在Hugging Face的下载量已经超过了300万次。
截至6月25日,ChatGLM2模型在主要评估LLM模型中文能力的C-Eval榜单中以71.1的分数位居 Rank0;而ChatGLM2-6B模型则以51.7的分数排名第六,是榜单上开源模型的排名最高的。
项目地址:https://github.com/THUDM/ChatGLM-6B
ChatGLM2-6B是ChatGLM-6B的第二代开源中英双语对话模型。在保留初代模型对话流畅、部署门槛较低等优秀特性的基础上,ChatGLM2-6B引入了以下新特性:
1.更强大的性能:基于ChatGLM初代模型的开发经验,ChatGLM2-6B全面升级了基座模型。采用GLM混合目标函数,利用1.4T中英文字符预先训练和人类偏好对齐的训练,ChatGLM2-6B相较初代模型在多项数据集上展现出的性能提升:在MMLU( 23%)、CEval( 33%)、GSM8K( 571%)、BBH( 60%)等数据集上有大幅度提升,使其在同一大小的开源模型中具有竞争力。
2.更长的上下文:基于FlashAttention技术,项目团队将基座模型的上下文长度(Context Length)从ChatGLM-6B的2K扩展到32K,并在对话阶段使用8K的上下文长度训练,以便进行更多轮次的对话。但是目前ChatGLM2-6B对于单轮超长文档的理解能力尚有限,团队将在后续升级中对其进行优化。
3.更高效的推理:基于Multi-Query Attention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用,官方模型实现下,推理速度相比初代提升了42%,在INT4量化下,6G显存支持的对话长度提高到了8K。
4.更开放的协议:ChatGLM2-6B模型权重对学术研究完全开放,在官方的书面许可下,也允许商业使用。
评测结果
以下为 ChatGLM2-6B 模型在 MMLU (英文)、C-Eval(中文)、GSM8K(数学)、BBH(英文) 上的测评结果。
推理性能
ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度。生成2000个字符的平均速度对比如下
Multi-Query Attention 同时也降低了生成过程中 KV Cache 的显存占用,此外,ChatGLM2-6B 采用 Causal Mask 进行对话训练,连续对话时可复用前面轮次的 KV Cache,进一步优化了显存占用。因此,使用6GB 显存的显卡进行 INT4量化的推理时,初代的 ChatGLM-6B 模型最多能够生成1119个字符就会提示显存耗尽,而 ChatGLM2-6B 能够生成至少8192个字符。
项目团队也测试了量化对模型性能的影响。结果表明,量化对模型性能的影响在可接受范围内。
示例对比
相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升,以下是一些对比示例。
数理逻辑
知识推理
长文档理解
今年我国快递业务量已达600亿件 618期间快递日均业务量破4亿
国家邮政局监测数据显示,截至6月24日,今年我国快递业务量已达600亿件,比2019年达到600亿件提前了172天,比2022年提前了34天。6月份以来,全国多个电商平台陆续启动年中促销活动,带动了快递业务量的新一轮增长。有数据显示,6月1日-6月18日电商大促期间,快递日均业务量突破4亿件,市场规模进一步扩增。站长网2023-06-25 23:41:070000智源研究院推出text-to-3D生成模型 GeoDream
近日,智源研究院联合清华和北邮团队推出text-to-3D生成模型GeoDream,能够将输入的文字描述转化为高质量和多视角一致性的3D资产。与传统的方法不同,GeoDream通过解耦的方式利用2D和3D先验,解决了3D结构不一致性的问题,并支持导出高保真的texturemeshes和高分辨率的渲染图片。站长网2024-01-16 10:08:170000智源研究院开源 AI 硬件评测引擎FlagPerf v1.0
智源研究院发布了FlagPerfv1.0,这是一个开源开放的AI硬件评测引擎。FlagPerf的评测指标体系包括功能正确性指标、性能指标、资源使用指标和生态适配指标。其中,功能正确性指标验证芯片对模型运行的支持,性能指标评估芯片的训练时间和计算吞吐量,资源使用指标衡量芯片和服务器其他零部件的使用情况,生态适配指标考察芯片对不同框架和软件生态的支持能力。站长网2023-09-28 08:46:260001被誉为「Web3 谷歌」的 The Graph 计划推出人工智能辅助查询功能
站长之家(ChinaZ.com)11月8日消息:TheGraph是一种用于索引和查询存储在区块链上的数据的协议,周二披露了一套新功能,计划添加大型语言模型(LLMs)辅助的查询功能。这标志着该项目自去年5000万美元融资以来的最大升级之一。站长网2023-11-08 15:34:040000智己汽车发布“智己生成式大模型Beta版” 预计10月上线
智己汽车正式发布“智己生成式大模型Beta版”,并将在10月与智己LS6车型一起交付并上线。据官方介绍,该大模型融合了千亿级参数,具备自然语言处理和机器学习能力,能够自动编排、自学习进化。它可以通过多重意图识别,精准理解用户的真实需求和指令,并结合历史交流偏好和习惯,为用户生成个性化、专属的出行体验。站长网2023-08-28 08:47:340000