通义千问开源基于Qwen1.5的代码模型CodeQwen1.5
通义千问昨晚开源了基于Qwen1.5的代码模型CodeQwen1.5,这是一个基于 Qwen 语言模型的代码专家模型。CodeQwen1.5拥有7B 参数,采用 GQA 架构,经过约3T tokens 代码数据的预训练,支持92种编程语言,并且能够处理最长64K 的上下文输入。
在代码生成、长序列建模、代码修改和 SQL 能力等方面,CodeQwen1.5展现出了卓越的性能,极大地提升了开发人员的工作效率,并简化了软件开发流程。

在代码生成方面,CodeQwen1.5已经超越了许多更大尺寸的模型,缩小了开源 CodeLLM 与 GPT-4之间在编码能力上的差距。通过 HumanEval 和 MBPP 的评估,CodeQwen1.5在各项指标上均表现出色。
此外,LiveCodeBench 的评估显示,CodeQwen1.5在 LeetCode、AtCoder 和 CodeForces 三个竞赛平台的问题上具有极强的泛化能力,尽管其预训练语料中包含了 LeetCode 的数据。
CodeQwen1.5不仅精通 Python,还支持多种编程语言。在 MultiPL-E 的8种主流语言上进行全面评估,CodeQwen1.5证明了其多语言编程的卓越能力。长序列能力对于代码模型至关重要,CodeQwen1.5通过精心构造的长序列代码数据预训练,实现了最长64K 输入长度的支持。
在实际应用方面,CodeQwen1.5在 SWE Bench 上的表现尤为突出,它能够理解代码仓库并生成可通过单测的代码,解决了真实软件开发中的问题。
CodeQwen1.5在代码修改方面的能力也得到了验证,它在 CodeEditorBench 的四个方面——Debug、Translate、Switch、Polish——均达到了最佳效果。
作为一个智能的 SQL 专家,CodeQwen1.5通过自然语言查询数据库,极大地降低了非编程专业人士与高效数据交互之间的学习曲线。在 Spider 和 Bird 两个流行的文本到 SQL 基准测试中,CodeQwen1.5的性能接近 GPT-4,显示了其在 SQL 领域的强大实力。
CodeQwen1.5作为 Qwen1.5开源家族的一员,目前已支持多种平台和工具,如 Transformers, vLLM, llama.cpp, Ollama 等。开源社区对 CodeQwen1.5的发布充满期待,希望它在代码助手、Code Agent 等方面为社区做出贡献,并在未来的代码智能建设中发挥重要作用,实现真正的 AI 程序员。
详细模型介绍:https://qwenlm.github.io/zh/blog/codeqwen1.5/
元象开源高性能大模型XVERSE-65B-Chat版 无条件免费商用
元象宣布开源高性能大模型XVERSE-65B-Chat版,无条件免费商用,为开发者构建和部署垂直领域应用提供强大且易用的工具。广大用户可登录大模型官网(chat.xverse.cn)或小程序体验。XVERSE-65B在SuperCLUE中文通用大模型综合基准测评中位居国内开源总分第一。站长网2023-12-15 08:48:440000戴珊携淘天背水一战
争夺定价权。2023年的双十一,阿里、京东、拼多多、抖音、快手、小红书……,中国几乎所有电商巨头都加入了低价竞争的行列。这样的拼杀,是中国互联网江湖从未有过的景象。全天候科技将借此呈现这个战场中多家公司的切面,观察和预测行业的发展和走向。站长网2023-11-01 17:48:320001小米汽车与理想、小鹏、蔚来开启充电补能网络合作
小米汽车今日宣布,已与理想、小鹏、蔚来三家知名车企达成合作协议,共同拓展充电补能网络。根据合作协议,理想、小鹏、蔚来的充电桩将接入小米充电网络,小米汽车用户将能够通过该网络实时查看充电场站的动态数据,并享受便捷的扫码充电与即插即充服务。0000Karpathy新教程爆火,网友抢着送他H100:从头复现GPT-2训练
大神Karpathy已经不满足于用C语言造Llama了!他给自己的最新挑战:复现OpenAI经典成果,从基础版GPT-2开始。挑战成功本身并不意外,但是只花费20美元、90分钟完成训练,Loss和评测还超越原版,就!有!点!过!分!了!。不仅如此,他把复现过程写成了完整教程,果不其然再次火爆。由于Karpathy自己租用的是A100云服务,训练124M版本花费20了美元。站长网2024-05-29 18:35:410000Luma AI发布Discord机器人Genie,实现文本生成3D模型
划重点:LumaAI发布了一款名为Genie的Discord机器人,它可以从文本提示生成3D内容,并在大约20秒内提供四个简单的3D模型。有望在游戏开发和虚拟制作领域找到应用,简化了复杂3D资产的创建,使艺术家有更多时间进行改进。目前,Genie作为研究预览版本免费提供,但将在未来推出付费服务。站长网2023-11-03 10:42:130000