清华ChatGLM2-6B模型允许免费商用 开启 AI 研究新纪元
站长网2023-07-18 16:35:011阅
清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布,他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重,允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。
ChatGLM-6B 模型是基于 General Language Model(GLM)架构的中英双语对话模型,拥有62亿参数。通过模型量化技术,该模型可以在消费级显卡上进行本地部署,最低只需6GB 显存。该模型具备问答和对话功能,初步展现了其在人工智能领域的应用潜力。
ChatGLM2-6B 模型在保留了初代模型的对话流畅和低门槛部署特性的基础上,增加了更多新特性。首先,它采用了 GLM 的混合目标函数,经过了1.4T 中英标识符的预训练和人类偏好对齐训练,性能得到了显著提升。其次,上下文长度从 ChatGLM-6B 的2K 扩展到了32K,可以处理更长的对话内容。第三,推理速度提升了42%,并且在 INT4量化下,6GB 显存可以支持更长的对话长度,从1K 提升到了8K。最重要的是,ChatGLM2-6B 的权重对学术研究是完全开放的,这对于推动人工智能技术的发展具有积极意义。
这两个模型的开放将为学术界和商业领域的研究者提供更多机会,推动人工智能的创新与应用。他们的发布也标志着清华大学在人工智能领域的重要突破,为全球的 AI 研究和应用探索开启了新的篇章。未来,我们可以期待更多基于 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和应用场景的出现,推动人工智能技术的发展进程。
0001
评论列表
共(0)条相关推荐
古茗向港交所提交上市申请书
1月2日,古茗控股有限公司向港交所提交上市申请书。数据显示,2023年,古茗的GMV达到人民币192亿元,较2022年增加37.2%。截至2023年12月31日,古茗的门店网络共有9,001家门店,较2022年12月31日增加35.0%。按截至2023年12月31日的门店数量计,古茗是全球前五大现制饮品品牌。站长网2024-01-02 17:01:280000百度第一季度营收315亿元 李彦宏:文心大模型将更加实惠和高效
百度公司今日公布了截至2024年3月31日的2024年第一季度财务报告,本季度,百度总营收达到315亿元,同比增长1%。在净利润方面,百度也取得了亮眼的成绩。归属于百度的净利润为54亿元,而按非美国通用会计准则(Non-GAAP)计算,净利润更是高达70亿元,同比增长22%,超出市场预期。站长网2024-05-16 17:34:060000微软人工智能研究人员泄露 38TB 数据:包括密钥、密码和 Teams 消息
微软的人工智能研究员在GitHub上发布开源训练数据存储桶时,意外暴露了数十TB的敏感数据,包括私钥和密码。云安全初创公司Wiz发现了这个属于微软AI研究部门的GitHub仓库,并将其作为其持续进行的云托管数据意外曝光工作的一部分分享给TechCrunch。站长网2023-09-19 08:56:430000消失的共享汽车:车场变坟场,千亿泡沫破裂,汽车沦为公共厕所
当共享成为流行,开发共享模式的人们只有两个下场一是大捞特捞,二是血本无归。似乎带上了共享二字,就没有任何缓冲地带要么疯狂加足油,狂飙突进譬如在城市里占有重要地位的共享单车、共享充电宝。要么一路下坠,江河日下一发不可收拾而这一类的代表就是今天要说的重点——共享汽车。不知道各位的城市里有没有共享汽车呢?大概率有,甚至还用过一两次但是现在,它们就像幽灵一样消失在我们的生活。站长网2023-05-23 22:31:390000多多直播面向全品类招募服务商和主播
拼多多旗下的直播带货业务——多多直播,正式开始全品类的服务商和主播招募工作。据相关服务商介绍,多多直播正在大规模引入服务商,以协助平台进行地区和品类的商家招募,并为商家品牌主播提供一对一的服务,执行官方运营规范和活动政策,提供投放代运营、直播代运营、货盘运营等服务。站长网2023-07-05 19:41:420003