智谱AI宣布开源 GLM 第四代模型 GLM-4-9B
GLM 技术团队于2023年3月14日开源了 ChatGLM-6B,引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B,开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作,GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-4-9B。
GLM-4-9B 在预训练方面引入了大语言模型进行数据筛选,获得了10T 高质量多语言数据,数据量是 ChatGLM3-6B 的3倍以上。同时,采用了 FP8技术进行高效的预训练,训练效率提高了3.5倍。在有限显存的情况下,探索了性能极限,发现6B 模型性能有限。考虑到大多数用户的显存大小,将模型规模提升至9B,并将预训练计算量增加了5倍。
GLM-4-9B 模型具备更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等能力。包括基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。
GLM-4-9B 的能力包括:
1. 基础能力:模型中英文综合性能比 ChatGLM3-6B 提升了40%;
2. 长文本能力:上下文从128K 扩展到1M tokens,相当于2本红楼梦或125篇论文的长度;
3. 多语言能力:支持26种语言,词表大小扩充到150k,编码效率提高30%;
4. Function Call 能力:在 Berkeley Function-Calling Leaderboard 上表现优秀;
5. All Tools 能力:模型可以使用外部工具完成任务;
6. 多模态能力:首次推出多模态模型,性能显著。
代码:
Github:https://github.com/THUDM/GLM-4
模型:
huggingface:https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
魔搭社区:https://modelscope.cn/organization/ZhipuAI
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【新智元导读】科学家正在通过AI的力量,改变乳腺癌的现状。在全球范围内,每年有超过60万名女性因乳腺癌而无法存活。美国有八分之一的女性一生中会被诊断出患有乳腺癌。这些数字听起来很可怕,但并非毫无希望。当处于最早的局部阶段时,5年相对生存率为99%。近年来,早期检测和治疗方法的进步显著提高了乳腺癌的生存率,目前美国有超过400万乳腺癌幸存者。AI,就是这项进步背后的一个重要推动性力量。站长网2024-08-07 14:11:020000网友建议退订短信由营销发送方承担资费 工信部回应:将认真研究
快科技9月16日消息,大多数手机号都会经常收到商家各种营销短信,这些短信大多以回复TD退订”、退订TD”等结尾,每条营销短信你有回复退订过吗?今年7月,有网友在人民网领导留言板块留言,称建议退订短信由营销信息发送方承担资费”。对此,工信部日前回应称:将认真研究”。站长网2023-09-16 11:56:120001共享充电宝性价比再引争议:电量用尽也才充电30%
近日,共享充电宝再次成为微博热搜的焦点。与以往不同的是,该次热搜的原因并非充电速度缓慢,而是无法完全给手机充满电的问题。据报道,一些用户反映,尽管他们将共享充电宝的电量用尽,但手机只能充入30%的电量。而当使用地图导航等应用时,充电速度甚至跟不上耗电速度。杭州市消保委的调查发现,有4.7%的受访者认为近年来充电宝的计费价格上涨过快,56.0%的受访者表示在不同场景下遇到了不同的收费标准。站长网2023-07-10 09:15:460001iQOO Pad2 Pro官宣:首批搭载天玑9300
快科技5月7日消息,今日,iQOO官宣了旗下最新平板产品iQOOPad2Pro,将首批搭载天玑9300移动平台。天玑9300于今日发布,是迄今为止最强的安卓移动处理器,CPU方面,这枚芯片延续了4个超大核4个大核的架构设计,CPU主频由前代9300的3.25GHz提升到了3.4GHz,安兔兔V10跑分更是突破230万分,也是安卓阵营唯一一款跑分突破230万的移动Soc。站长网2024-05-07 16:36:560000OpenAI开发新工具,试图解释大语言模型的行为
在很多人看来,与OpenAI的ChatGPT类似的大型语言模型(LLM)就像一个黑匣子,因为即使对于数据科学家来说,也很难知道为什么这些模型总是以自己的方式做出反应,就像凭空捏造事实一样。站长网2023-05-10 10:32:210000