智谱AI宣布开源 GLM 第四代模型 GLM-4-9B
GLM 技术团队于2023年3月14日开源了 ChatGLM-6B,引起了广泛的关注和认可。随后又开源了 ChatGLM3-6B,开发者对 GLM 第四代模型的开源充满期待。经过近半年的探索工作,GLM 技术团队推出了第四代 GLM 系列开源模型:GLM-4-9B。
GLM-4-9B 在预训练方面引入了大语言模型进行数据筛选,获得了10T 高质量多语言数据,数据量是 ChatGLM3-6B 的3倍以上。同时,采用了 FP8技术进行高效的预训练,训练效率提高了3.5倍。在有限显存的情况下,探索了性能极限,发现6B 模型性能有限。考虑到大多数用户的显存大小,将模型规模提升至9B,并将预训练计算量增加了5倍。

GLM-4-9B 模型具备更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools 等能力。包括基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。
GLM-4-9B 的能力包括:
1. 基础能力:模型中英文综合性能比 ChatGLM3-6B 提升了40%;
2. 长文本能力:上下文从128K 扩展到1M tokens,相当于2本红楼梦或125篇论文的长度;
3. 多语言能力:支持26种语言,词表大小扩充到150k,编码效率提高30%;
4. Function Call 能力:在 Berkeley Function-Calling Leaderboard 上表现优秀;
5. All Tools 能力:模型可以使用外部工具完成任务;
6. 多模态能力:首次推出多模态模型,性能显著。
代码:
Github:https://github.com/THUDM/GLM-4
模型:
huggingface:https://huggingface.co/collections/THUDM/glm-4-665fcf188c414b03c2f7e3b7
魔搭社区:https://modelscope.cn/organization/ZhipuAI
恒生电子发布金融行业大模型LightGPT
今天下午,恒生电子发布了金融行业的大模型LightGPT。该产品计划在9月底完成金融能力的新一轮升级,并正式开放试用接口。LightGPT利用超过4000亿个tokens的金融领域数据和超过400亿个tokens的语种增强数据进行了二次预训练,支持超过80个金融专属任务的微调。可以为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层的AI能力支持。站长网2023-06-29 11:34:550000“跨时空拥抱”风靡TikTok,这款AI视频工具借势变现20万美金
用AI生成跨时空拥抱最近悄悄在海外翻红,还带火了一款AI视频产品。8月28日,TikTok博主“iammskira”发布了一条配文为“用AI实现了拥抱我的妈妈,因为她已经不在人世了”的短视频教程,在TikTok上走红。视频中,AI不仅将两张不同时空中拍摄的照片丝滑地融合在了一起,人物形象也保持高度一致,整体效果非常自然。截至目前,该条视频的播放量已超1130万,获赞38万,收藏量破17万。站长网2024-09-19 21:23:420000万兴科技发布百亿级参数多媒体大模型 “天幕”
在近日的2023世界计算大会上,万兴科技宣布将发布国内首个以视频创意应用为核心的百亿级参数多媒体大模型“天幕”。“天幕”多媒体大模型将以视频、绘图、文档等数字创意软件业务场景为依托,为创作者提供更专业化的AI创新解决方案。它涵盖了视觉、音频、语言等多模态AI生成和优化的能力,具备一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等核心功能。站长网2023-09-18 10:01:440000法国亿万富翁 Xavier Niel 将投资 2 亿欧元发展人工智能:与 OpenAI 等公司竞争
站长之家(ChinaZ.com)9月27日消息:法国亿万富翁XavierNiel正在向人工智能领域投资2亿欧元(约合2.12亿美元),主要用于在巴黎建立一个未来研究实验室、利用英伟达(Nvidia)公司硬件提供云超级计算能力,以及为初创企业提供资金。站长网2023-09-27 10:20:180000百度百家号多元变现产品全新升级 推出“变现任务”页面
9月19日,百度百家号多元变现产品全新升级,推出“变现任务”页面,聚合度星选商单、付费内容、电商带货、百享计划(私域广告)、问一问、赞赏等六大变现模式,一站式帮助创作者全方位变现。站长网2023-09-22 10:55:140000