智谱AI宣布开源 GLM 第四代模型 GLM-4-9B
GLM 技术团队于2023年3月14日开源了 ChatGLM-6B,引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B,开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作,GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-4-9B。
GLM-4-9B 在预训练方面引入了大语言模型进行数据筛选,获得了10T 高质量多语言数据,数据量是 ChatGLM3-6B 的3倍以上。同时,采用了 FP8技术进行高效的预训练,训练效率提高了3.5倍。在有限显存的情况下,探索了性能极限,发现6B 模型性能有限。考虑到大多数用户的显存大小,将模型规模提升至9B,并将预训练计算量增加了5倍。
GLM-4-9B 模型具备更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等能力。包括基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。
GLM-4-9B 的能力包括:
1. 基础能力:模型中英文综合性能比 ChatGLM3-6B 提升了40%;
2. 长文本能力:上下文从128K 扩展到1M tokens,相当于2本红楼梦或125篇论文的长度;
3. 多语言能力:支持26种语言,词表大小扩充到150k,编码效率提高30%;
4. Function Call 能力:在 Berkeley Function-Calling Leaderboard 上表现优秀;
5. All Tools 能力:模型可以使用外部工具完成任务;
6. 多模态能力:首次推出多模态模型,性能显著。
代码:
Github:https://github.com/THUDM/GLM-4
模型:
huggingface:https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
魔搭社区:https://modelscope.cn/organization/ZhipuAI
商汤回应自研大模型图片生产质疑:也提供第三方开源模型
据财联社报道,针对商汤技术交流日上精选模型出现AI模型站civitai的图片一事,商汤方面表示,秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型,支持导入多个平台的开源模型或上传用户本地模型。用户可免除本地化部署流程,并基于开源模型自训练模型,高效地生成更多样的内容。站长网2023-04-12 16:41:410000蕉下在推的“轻量化户外”,资本会买账吗?
随着天气温度逐渐上升,以防晒伞出名的蕉下已按耐不住内心的躁动,开始频繁活跃在大众视线里。只不过在第十年这一重要关口,蕉下也换了个方式打市场。3月6日,蕉下邀请歌手谭维维演唱,发布了首个品牌视频《惊蛰令》,宣布了“轻量化户外”这一新的品牌定位,同时发售了第一款轻量化全地形户外鞋“惊蛰鞋”。站长网2023-04-25 17:37:240000岸田文雄:G7 峰会将讨论 ChatGPT,必须制定国际规则
据共同社消息,日本首相岸田文雄19日表示,七国集团(G7)领导人将在5月G7广岛峰会期间讨论讨论生成性人工智能ChatGPT相关议题,称「必须制定国际规则」。站长网2023-04-20 16:30:150000微博已接入阿里云通义大模型 覆盖AI评论、明星陪聊等功能
站长之家(ChinaZ.com)5月18日消息:据阿里云官方消息,微博宣布已成功将阿里云的大模型技术融入其核心业务,开启了一个全新的智能互动时代。这一融合不仅覆盖了AI评论、AI明星陪聊、虚拟角色帐号、星座大模型,更在信息流广告创意生成等领域展现出了显著成效。站长网2024-05-18 10:10:220000时薪15美元的ChatGPT外包工人,干的都是苦力活
自ChatGPT去年11月发布以来,让不少打工人陷入担心失业的恐慌中,也解决了部分人的“就业问题”。34岁的AlexejSavreux,就是其中之一。作为ChatGPT外包大军的一员,这份工作让AlexejSavreux从体力劳动的工人,摇身一变成为了AI训练师。然而,华丽的蜕变之后,这份工作似乎没有想象中的光鲜……除15美元时薪外,没有其它福利站长网2023-05-09 09:25:030000