清华ChatGLM2-6B模型允许免费商用开启 AI 研究新纪元

站长网2023-07-18 16:35:011阅

清华大学的 NLP 团队与智谱 AI 及清华 KEG 实验室宣布，他们的 ChatGLM-6B 和 ChatGLM2-6B 模型现已完全开放权重，允许学术研究和商业使用。这两个模型在人工智能研究领域具有重要意义。

ChatGLM-6B 模型是基于 General Language Model（GLM）架构的中英双语对话模型，拥有62亿参数。通过模型量化技术，该模型可以在消费级显卡上进行本地部署，最低只需6GB 显存。该模型具备问答和对话功能，初步展现了其在人工智能领域的应用潜力。

ChatGLM2-6B 模型在保留了初代模型的对话流畅和低门槛部署特性的基础上，增加了更多新特性。首先，它采用了 GLM 的混合目标函数，经过了1.4T 中英标识符的预训练和人类偏好对齐训练，性能得到了显著提升。其次，上下文长度从 ChatGLM-6B 的2K 扩展到了32K，可以处理更长的对话内容。第三，推理速度提升了42%，并且在 INT4量化下，6GB 显存可以支持更长的对话长度，从1K 提升到了8K。最重要的是，ChatGLM2-6B 的权重对学术研究是完全开放的，这对于推动人工智能技术的发展具有积极意义。

这两个模型的开放将为学术界和商业领域的研究者提供更多机会，推动人工智能的创新与应用。他们的发布也标志着清华大学在人工智能领域的重要突破，为全球的 AI 研究和应用探索开启了新的篇章。未来，我们可以期待更多基于 ChatGLM-6B 和 ChatGLM2-6B 模型的研究成果和应用场景的出现，推动人工智能技术的发展进程。

清华ChatGLM26B模型允许免费商用开启 AI 研究新纪元

0001

评论列表

共(0)条

相关推荐

赚钱的10个真相，越早知道越好！
各位村民好，我是村长很多人想要赚钱，但却对这个社会赚钱的规律毫无认知。盲目地付出自己的脑力、体力，最终还是赚不到钱。其实说实话，赚钱是有底层规律的，赚钱是有一些基本认知的。当你把这些想清楚搞明白的时候，你对于赚钱的理解自然就轻松很多。01赚钱源自于用户有真需求不管你是线下开店、摆摊、线上做课程、拍短视频，你都要去思考一点。你做的这些东西是你自己自嗨，还是用户真的有需求。
站长网站长资讯2024-01-31 21:46:42
0000
站长资讯
比利时创企SettleMint推AI助手，让Web3开发者轻松编写智能合约
本文要点:-SettleMint最近在其平台上添加了AI助手，帮助开发人员编写智能合约、集成数据和提高质量保证测试。-AI助手可以帮助开发人员理解代码，避免漏洞，并提供修改建议，但仍需要进行技术审计来确保代码的准确性。-尽管数字货币价格下跌，SettleMint在过去一年中经历了稳定的用户增长。
站长网2023-08-03 15:07:52
0000
站长资讯
OpenAI深夜变天，CEO奥特曼被炒鱿鱼！联创Brockman辞职力挺，女CTO临时补位
【新智元导读】谁能想到，OpenAI这家独角兽的内部也是暗流汹涌，昨夜的大动荡中，SamAltman竟然在权力游戏中意外出局?更惊人的是，关于他虐待亲妹妹的爆料，也开始大肆传播。今早传来惊人消息，SamAltman，前OpenAI首席执行官，竟然已被辞退!
站长网2023-11-18 14:41:09
0003
站长资讯
新时代财富密码？AI算出刮刮乐中奖编号
10月12日，抖音用户“亿万负翁”发布了一条视频，声称使用AI算出了刮刮乐中奖编号。他在类似ChatGPT的对话页面上要求AI根据坤兑卦的特性计算出当天的幸运编号，结果得到了6、15、24这三个号码，并连续中奖。
站长网2023-10-18 22:18:50
0001
站长资讯
3个月发布多个现金激励政策，支付宝加大内容生态投入
近期，支付宝在内容侧持续发力，支付宝商家平台官网发布的公告显示，3个月内，面向个人创作者和MCN机构接连发布多项激励政策。据了解，新政策主要集中在创作者入驻激励和基于优质内容的激励，包括根据外站粉丝量给与MCN和个人达人入驻现金激励的《支付宝创作·MCN邀约计划》和《支付宝创作·达人邀约计划》，以及按短视频有效播放量给予现金激励的《支付宝创作·分成计划》。
站长网2023-09-05 12:14:40
0001