通义千问开源基于Qwen1.5的代码模型CodeQwen1.5
通义千问昨晚开源了基于Qwen1.5的代码模型CodeQwen1.5,这是一个基于 Qwen 语言模型的代码专家模型。CodeQwen1.5拥有7B 参数,采用 GQA 架构,经过约3T tokens 代码数据的预训练,支持92种编程语言,并且能够处理最长64K 的上下文输入。
在代码生成、长序列建模、代码修改和 SQL 能力等方面,CodeQwen1.5展现出了卓越的性能,极大地提升了开发人员的工作效率,并简化了软件开发流程。
在代码生成方面,CodeQwen1.5已经超越了许多更大尺寸的模型,缩小了开源 CodeLLM 与 GPT-4之间在编码能力上的差距。通过 HumanEval 和 MBPP 的评估,CodeQwen1.5在各项指标上均表现出色。
此外,LiveCodeBench 的评估显示,CodeQwen1.5在 LeetCode、AtCoder 和 CodeForces 三个竞赛平台的问题上具有极强的泛化能力,尽管其预训练语料中包含了 LeetCode 的数据。
CodeQwen1.5不仅精通 Python,还支持多种编程语言。在 MultiPL-E 的8种主流语言上进行全面评估,CodeQwen1.5证明了其多语言编程的卓越能力。长序列能力对于代码模型至关重要,CodeQwen1.5通过精心构造的长序列代码数据预训练,实现了最长64K 输入长度的支持。
在实际应用方面,CodeQwen1.5在 SWE Bench 上的表现尤为突出,它能够理解代码仓库并生成可通过单测的代码,解决了真实软件开发中的问题。
CodeQwen1.5在代码修改方面的能力也得到了验证,它在 CodeEditorBench 的四个方面——Debug、Translate、Switch、Polish——均达到了最佳效果。
作为一个智能的 SQL 专家,CodeQwen1.5通过自然语言查询数据库,极大地降低了非编程专业人士与高效数据交互之间的学习曲线。在 Spider 和 Bird 两个流行的文本到 SQL 基准测试中,CodeQwen1.5的性能接近 GPT-4,显示了其在 SQL 领域的强大实力。
CodeQwen1.5作为 Qwen1.5开源家族的一员,目前已支持多种平台和工具,如 Transformers, vLLM, llama.cpp, Ollama 等。开源社区对 CodeQwen1.5的发布充满期待,希望它在代码助手、Code Agent 等方面为社区做出贡献,并在未来的代码智能建设中发挥重要作用,实现真正的 AI 程序员。
详细模型介绍:https://qwenlm.github.io/zh/blog/codeqwen1.5/
AI赚钱案例:基于ChatGPT构建AI约会应用 下载量150万、月入19万美元
RIZZ是一款基于ChatGPT构建的AI约会教练应用,帮助用户利用人工智能调情够生成个性化的回复,从而在约会和社交中脱颖而出。据了解,这款应用开发者以其独特的市场定位和商业策略,仅用四个半的时间下载量达150万,成功实现了每月19万美元的营收。站长网2024-05-09 19:40:330004工信部通报62款侵害用户权益应用:怪兽充电、茶百道在列
工信部今日在其官网发布了关于侵害用户权益的App及SDK的通报,这是2024年的第二批通报,也是总第37批通报。此次通报主要针对用户普遍反映的“摇一摇”乱跳转、信息窗口无法关闭,以及违规收集和使用个人信息等问题展开。站长网2024-03-14 14:10:280000全新人形通用机器人Phoenix机器人发布最新演示视频 灵活度、精确性更高
SanctuaryAI公司最近发布了一款全新的人形通用机器人——Phoenix,其发布的演示视频令人震惊。在视频中,Phoenix机器人展示了其在速度、精确性和力量方面的卓越能力,而且这些展示并没有任何加速处理。站长网2024-02-29 17:05:170000伦敦帝国理工学院和 DeepMind联合设计AI框架 统一强化学习智能体
伦敦帝国理工学院和DeepMind的研究人员设计了一个AI框架,将语言作为强化学习智能体的核心推理工具。该框架利用了大型语言模型和视觉语言模型,能够有效解决强化学习中的几个基本问题,包括在奖励稀疏环境中的高效探索、顺序学习中的数据重用、新任务的能力调度以及从专家智能体的观察中学习。站长网2023-07-28 09:27:480001ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天
在2024世界经济论坛的一次会谈中,图灵奖得主YannLeCun提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间[1]。借助文本信息的多模态视频表征学习可抽取利于视频理解或内容生成的特征,正是促进该过程的关键技术。站长网2024-03-06 09:47:270000