清华ChatGLM2-6B模型允许免费商用 开启 AI 研究新纪元
站长网2023-07-18 16:35:011阅
清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布,他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重,允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。
ChatGLM-6B 模型是基于 General Language Model(GLM)架构的中英双语对话模型,拥有62亿参数。通过模型量化技术,该模型可以在消费级显卡上进行本地部署,最低只需6GB 显存。该模型具备问答和对话功能,初步展现了其在人工智能领域的应用潜力。
ChatGLM2-6B 模型在保留了初代模型的对话流畅和低门槛部署特性的基础上,增加了更多新特性。首先,它采用了 GLM 的混合目标函数,经过了1.4T 中英标识符的预训练和人类偏好对齐训练,性能得到了显著提升。其次,上下文长度从 ChatGLM-6B 的2K 扩展到了32K,可以处理更长的对话内容。第三,推理速度提升了42%,并且在 INT4量化下,6GB 显存可以支持更长的对话长度,从1K 提升到了8K。最重要的是,ChatGLM2-6B 的权重对学术研究是完全开放的,这对于推动人工智能技术的发展具有积极意义。
这两个模型的开放将为学术界和商业领域的研究者提供更多机会,推动人工智能的创新与应用。他们的发布也标志着清华大学在人工智能领域的重要突破,为全球的 AI 研究和应用探索开启了新的篇章。未来,我们可以期待更多基于 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和应用场景的出现,推动人工智能技术的发展进程。
0001
评论列表
共(0)条相关推荐
亚马逊CEO安迪·贾西表示生成式人工智能将改变每位顾客的体验
**划重点:**1.🌐安迪·贾西表示生成式人工智能将在亚马逊企业和自由消费者业务中改变顾客体验。2.🚀生成式人工智能将使开发者和业务用户更容易使用,提高社会效益。3.🗣️贾西认为亚马逊将在生成式人工智能领域取得领导地位,将其应用于改进购物体验和升级虚拟助手Alexa。站长网2023-12-08 18:51:250001iQOO 12 Pro官宣防护升级 支持IP68级防尘防水
iQOO手机今日宣布,iQOO12系列将具备IP68级防尘防水功能。除了出色的防尘防水功能,iQOO12还配备了1.5K柔性OLED直屏,并搭载了高通骁龙8Gen3移动平台,同时配备了满血版LPDDR5X和UFS4.0,使得即使在重载游戏的情况下也能轻松应对。这款新机将于11月7日晚上19:00正式发布。站长网2023-11-02 11:52:460000英伟达与富士康合作开发以 AI 为重点的新型数据中心
站长之家(ChinaZ.com)10月18日消息:今天在鸿海科技日活动中,英伟达首席执行官黄仁勋和鸿海集团董事长刘扬伟共同宣布,两家公司正在合作建立一个人工智能(AI)工厂。英伟达表示,它正在扩大与鸿海科技集团(富士康)的持续合作,以加速AI驱动的电动车和机器人平台的开发。作为合作的一部分,鸿海计划开发一个名为「AI工厂」的新型数据中心,以支持制造数字和生成式AI服务等创新。站长网2023-10-18 21:48:420002门票炒到60000元,周杰伦演唱会的黄牛“集体退票”,但钱没少赚?
10月12日,为期四天的周杰伦上海站演唱会正式开唱。这原本是杰迷们最翘首以盼的时刻,但有一些早早买了票、定好了行程的粉丝,却没能如愿到场。就在演唱会前一天,大批黄牛集体退票的消息登上热搜。有卖家表示,主办方原定的给录入信息如今不兑现,因此都在退单。但这套说辞并没有得到所有粉丝的认可,在微博、豆瓣、小红书等社交平台,有不少粉丝提出,“不过是看价格炒起来了,想要多赚一笔。”站长网2023-10-13 17:10:110000450分钟超长视频成现象级爆款,抖音“越来越长”了
一条长达900分钟的数学解说视频,在抖音火了。900分钟,足足15个小时。视频作者“嘉靖学长-只讲干货”在片头就放话“本视频耗时15年半制作,共计900分钟,带你一口气学完高中数学”。这条视频自8月10日在抖音发布便炸开了锅,截至目前获赞328万次,收藏和转发均超过了290万次,评论区的网友们呼朋引伴组团围观。站长网2024-08-22 14:03:270000