GLM技术团队宣布代码模型CodeGeeX2-6B开源
GLM技术团队宣布,「代码生成模型 CodeGeeX2-6B」正式开源。
CodeGeeX2是多语言代码生成模型 CodeGeeX 的第二代模型,基于 ChatGLM2架构注入代码实现。得益于 ChatGLM2的更优性能,CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与150亿参数的 StarCoder-15B 相比,CodeGeeX2-6B 凭借60亿参数便具备了近10% 的优势。

具体特性如下:
更强大的代码能力:基于 ChatGLM2-6B 基座语言模型,CodeGeeX2-6B 进一步经过了600B 代码数据预训练,相比一代模型,在代码能力上全面提升,HumanEval-X 评测集的六种编程语言均大幅提升 (Python 57%, C 71%, Java 54%, JavaScript 83%, Go 56%, Rust 321%),在Python上达到35.9% 的 Pass@1一次通过率,超越规模更大的 StarCoder-15B。
更优秀的模型特性:继承 ChatGLM2-6B 模型特性,CodeGeeX2-6B 更好支持中英文输入,支持最大8192序列长度,推理速度较一代 CodeGeeX-13B 大幅提升,量化后仅需6GB显存即可运行,支持轻量级本地化部署。
更全面的AI编程助手:CodeGeeX插件(VS Code, Jetbrains)后端升级,支持超过100种编程语言,新增上下文补全、跨文件补全等实用功能。结合 Ask CodeGeeX 交互式AI编程助手,支持中英文对话解决各种编程问题,包括且不限于代码解释、代码翻译、代码纠错、文档生成等,帮助程序员更高效开发。
更开放的协议:CodeGeeX2-6B 权重对学术研究完全开放。
代码地址:https://github.com/THUDM/CodeGeeX2
阿里巴巴张勇:已有20万企业用户申请接入通义千问进行测试
2023年的阿里云合作伙伴大会上,阿里巴巴集团董事会主席兼首席执行官、阿里云智能集团首席执行官张勇讲述了“通义千问”推向市场,进一步升级智能化服务能力。站长网2023-04-26 10:56:210000这个春节大家都在看什么?哪吒创影史纪录,DeepSeek刷屏全网
这个春节是属于DeepSeek和哪吒的。除夕前夜,横空出世的DeepSeek不仅让英伟达一夜股价狂跌近17%,也成为国内互联网圈的当红炸子鸡。在抖音,DeepSeek相关话题的累计播放量超60亿;在B站,“_deepseek”靠着分享DeepSeek的使用教程,从零开始7天涨粉超10万。站长网2025-02-07 02:48:000000Meta 抢先苹果传闻中的 AR/VR 头显之前宣布推出 Quest 3
Meta今天宣布了Quest3,这是其即将在今年推出的下一代混合现实头戴式设备。这一消息发布的时间正好在WWDC之前,届时苹果有望发布其备受期待的首款AR/VR头显。图片来自Meta站长网2023-06-03 10:46:240000小红书打击通过不当投诉牟利行为
薯管家发布消息称,小红书坚持打造真诚分享、友好互动的社区氛围,严厉打击通过不当投诉非法牟利的内容和行为。近年来,随着投诉维权渠道增多,个别账号发布回收垃圾短信的内容,借此不当牟取利益。上述内容和行为严重扰乱了正常的市场秩序,破坏了平台生态和良好氛围。小红书对此类不当投诉牟利行为坚决抵制,对此类传播内容进行严厉打击。站长网2023-06-12 17:53:220000AI日报:阿里云发布音频模型Qwen2-Audio;字节将推类sora模型;AI眼里13.11>13.8
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen2-Audio:千问系列的音频多模态模型无需文字即可语音交互站长网2024-07-17 17:10:170001