ChatGLM2-6B 发布 相比初代推理提速42%
GLM技术团队宣布升级ChatGLM-6B,并发布了ChatGLM2-6B。之前发布的ChatGLM-6B在3月14日上线,截至6月24日,其在Hugging Face的下载量已经超过了300万次。
截至6月25日,ChatGLM2模型在主要评估LLM模型中文能力的C-Eval榜单中以71.1的分数位居 Rank0;而ChatGLM2-6B模型则以51.7的分数排名第六,是榜单上开源模型的排名最高的。
项目地址:https://github.com/THUDM/ChatGLM-6B
ChatGLM2-6B是ChatGLM-6B的第二代开源中英双语对话模型。在保留初代模型对话流畅、部署门槛较低等优秀特性的基础上,ChatGLM2-6B引入了以下新特性:
1.更强大的性能:基于ChatGLM初代模型的开发经验,ChatGLM2-6B全面升级了基座模型。采用GLM混合目标函数,利用1.4T中英文字符预先训练和人类偏好对齐的训练,ChatGLM2-6B相较初代模型在多项数据集上展现出的性能提升:在MMLU( 23%)、CEval( 33%)、GSM8K( 571%)、BBH( 60%)等数据集上有大幅度提升,使其在同一大小的开源模型中具有竞争力。
2.更长的上下文:基于FlashAttention技术,项目团队将基座模型的上下文长度(Context Length)从ChatGLM-6B的2K扩展到32K,并在对话阶段使用8K的上下文长度训练,以便进行更多轮次的对话。但是目前ChatGLM2-6B对于单轮超长文档的理解能力尚有限,团队将在后续升级中对其进行优化。
3.更高效的推理:基于Multi-Query Attention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用,官方模型实现下,推理速度相比初代提升了42%,在INT4量化下,6G显存支持的对话长度提高到了8K。
4.更开放的协议:ChatGLM2-6B模型权重对学术研究完全开放,在官方的书面许可下,也允许商业使用。
评测结果
以下为 ChatGLM2-6B 模型在 MMLU (英文)、C-Eval(中文)、GSM8K(数学)、BBH(英文) 上的测评结果。
推理性能
ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度。生成2000个字符的平均速度对比如下
Multi-Query Attention 同时也降低了生成过程中 KV Cache 的显存占用,此外,ChatGLM2-6B 采用 Causal Mask 进行对话训练,连续对话时可复用前面轮次的 KV Cache,进一步优化了显存占用。因此,使用6GB 显存的显卡进行 INT4量化的推理时,初代的 ChatGLM-6B 模型最多能够生成1119个字符就会提示显存耗尽,而 ChatGLM2-6B 能够生成至少8192个字符。
项目团队也测试了量化对模型性能的影响。结果表明,量化对模型性能的影响在可接受范围内。
示例对比
相比于初代模型,ChatGLM2-6B 多个维度的能力都取得了提升,以下是一些对比示例。
数理逻辑
知识推理
长文档理解
OpenAI 正在与 Helion Energy 洽谈“购买大量”聚变能源
据《华尔街日报》报道,西雅图地区的核聚变公司HelionEnergy正在与OpenAI洽谈一项重大交易,计划为后者的数据中心提供大量电力。OpenAI首席执行官兼联合创始人SamAltman已向Helion投资3.75亿美元,并担任该公司董事会主席。据报道,Altman在此次交易谈判中回避了直接参与。站长网2024-06-04 14:56:290000李彦宏称“程序员”职业将不复存在:会说话就能当程序员!
快科技3月10日消息,在昨天央视的《对话》开年说节目上,百度创始人、董事长兼CEO李彦宏表示,未来只要会说话就能具备今天程序员所具备的能力。当被问及未来两年大模型会给人类的生产生活带来什么改变时,李彦宏回答道:我认为大模型对于人类生产生活的改变会是非常根本性的。”互联网改变了我们的很多生活,但是这一波人工智能的改变,会更加的彻底、更加的深刻。0000完胜Win自带功能 文件复制神器FastCopy 5.0升级:SSD提速30%
快科技4月15日消息,CtrlC、CtrlV复制粘贴是电脑使用中最常见的操作之一,小文件可以用Win自带功能,大量数据拷贝的话自带功能就有些弱了,很多人都知道FastCopy这个神器,完胜Win自带复制功能。站长网2023-04-15 17:38:400003TikTok 正在测试使用 AI 生成的搜索结果
划重点:-🧠TikTok正在测试AI生成的搜索结果,称为“highlights”。-📲AI智能搜索功能通过ChatGPT生成内容,并在搜索结果页面顶部显示。-🔍TikTok试图满足对搜索内容的需求,特别是年轻用户,通过AI结果展示满足用户搜索习惯。站长网2024-05-14 10:27:000000联想将推出多款搭载 AMD AI 引擎的计算机:改变 PC 体验
AMD在今年推出了锐龙PRO7040系列处理器,这是业界首款具有专用AI引擎的x86处理器。根据AMD的预测,AMD锐龙AI技术将为客户在新一代协作、创造力和生产力、预测性界面以及采用AI技术的安全功能等方面带来卓越的体验优势。站长网2023-08-04 10:31:190000