清华ChatGLM2-6B模型允许免费商用 开启 AI 研究新纪元
站长网2023-07-18 16:35:011阅
清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布,他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重,允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。
ChatGLM-6B 模型是基于 General Language Model(GLM)架构的中英双语对话模型,拥有62亿参数。通过模型量化技术,该模型可以在消费级显卡上进行本地部署,最低只需6GB 显存。该模型具备问答和对话功能,初步展现了其在人工智能领域的应用潜力。
ChatGLM2-6B 模型在保留了初代模型的对话流畅和低门槛部署特性的基础上,增加了更多新特性。首先,它采用了 GLM 的混合目标函数,经过了1.4T 中英标识符的预训练和人类偏好对齐训练,性能得到了显著提升。其次,上下文长度从 ChatGLM-6B 的2K 扩展到了32K,可以处理更长的对话内容。第三,推理速度提升了42%,并且在 INT4量化下,6GB 显存可以支持更长的对话长度,从1K 提升到了8K。最重要的是,ChatGLM2-6B 的权重对学术研究是完全开放的,这对于推动人工智能技术的发展具有积极意义。
这两个模型的开放将为学术界和商业领域的研究者提供更多机会,推动人工智能的创新与应用。他们的发布也标志着清华大学在人工智能领域的重要突破,为全球的 AI 研究和应用探索开启了新的篇章。未来,我们可以期待更多基于 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和应用场景的出现,推动人工智能技术的发展进程。
0001
评论列表
共(0)条相关推荐
招聘公司采用 AI 技术提高效率和候选人数量
划重点:-招聘公司正在采用生成型人工智能技术来识别候选人和提高效率,以应对就业市场的冷却。-AI技术可以帮助招聘人员在更广泛、更不寻常的地方寻找人才,并通过筛选和扫描数百万份应聘申请来识别更多候选人。-AI技术还可以帮助求职者,在初步申请阶段与聊天机器人进行“类人对话”,并帮助招聘人员节省时间,与雇主和求职者建立关系。站长网2023-11-03 14:23:240000ChatGPT代码库变更:新增文本朗读功能 DALL·E 3 新增67种图像风格
2月24日ChatGPT代码库进行了一些变动,与英语语言/翻译文件、图像生成样式图像、工作区设置.groups、ReadAloud/AudioPlayer等相关的一些内容发生了更改!具体如下:站长网2024-02-26 10:24:260002从谷歌看大模型如何深刻改变互联网广告?
在这一次波澜壮阔的AIGC大潮中,哪一个垂直细分领域离钱更近?互联网广告绝对是最靠前的答案,甚至没有之一。作为互联网第一大商业模式,广告的整个链路和过程本身都和AI有着千丝万缕的联系,而作为科学与艺术的交叉行业,广告的属性和货币化潜能也驱动着AIGC商业化天平朝广告的方向倾斜。在主流观点中,硅谷科技巨头中在大模型领域走在最前列的是微软和它投资的OpenAI。站长网2023-07-20 18:15:580004硅谷AI圈爆火热文:AIGC热潮退后,最大输家或为Jasper和VC
要点:在AI创业热潮中,像Jasper等公司及其支持者成为最大输家,随着投资热潮退潮,市场分化显现。Jasper等公司未能在通用市场中脱颖而出,而在聊天机器人领域筹资的创业公司缺乏技术壁垒,企业对AI的期望被过度高估。成功者包括老牌科技公司和市场占有者,以及独立开发者和小型公司,后者迅速推出针对利基市场的产品,形成微型SaaS的新趋势。站长网2023-12-22 14:27:540000著名物理学家将人工智能聊天机器人称为「美化的录音机」
著名理论物理学家MichioKaku表示,公众对新的人工智能技术的焦虑是错误的。在周日接受CNN的FareedZakaria采访时,这位未来学家表示,OpenAI的ChatGPT等聊天机器人将有益于社会,并提高生产力。但恐惧驱使人们主要关注这些程序的负面影响,他称其为「被美化的录音机」。站长网2023-08-14 09:47:520000