登陆注册
11439

北大最强代码大模型CodeShell-7B开源 提供全栈智能编程支持

站长网2023-10-19 15:01:400

要点:

北大等机构开源了性能卓越的代码基座大模型CodeShell-7B,提供轻量高效的智能代码助手,同时开源IDE插件,支持各种编程语言。

CodeShell-7B基于5000亿Tokens的冷启动训练,在代码评估基准上表现出众,超过了竞争对手的模型。支持中英文和代码的编解码,性能优越。

CodeShell还开源了完整的代码助手模型CodeShell-Chat,以及与VSCode和JetBrains IDE兼容的插件,为开发者提供全栈开源解决方案,实现了本地化轻量化的智能代码助手。

今天,北大等机构宣布开源CodeShell-7B代码基座大模型和CodeShell-Chat代码助手,加上便捷的IDE插件,为编程提供强大支持。CodeShell-7B采用5000亿Tokens的冷启动训练,在评估基准上表现卓越,超越了竞争对手。

CodeShell-Chat是一款全能代码助手模型,支持对话、代码生成、补齐、注释和测试用例生成。团队还发布了支持VSCode和IntelliJ IDEA的IDE插件,提供专注和交互模式,提高开发效率。

CodeShell代码:https://github.com/WisdomShell/codeshell

CodeShell基座模型:https://huggingface.co/WisdomShell/CodeShell-7B

代码助手VSCode插件:https://github.com/WisdomShell/codeshell-vscode

CodeShell-7B采用高效的数据治理,经过5000亿Token的冷启动预训练,性能明显优于竞争模型,支持中英文和代码编解码。模型基于自采集的Github数据、Stack和StarCoder数据集,经过数据治理构建高质量的预训练数据。

此外,CodeShell-Chat在真实软件开发场景中进行高效微调,支持多任务代码对话和补齐。团队还开发了轻量本地部署工具,支持多种计算架构。

IDE插件支持VSCode和IntelliJ IDEA,提供专注和交互模式。在专注模式下,分析当前项目代码并提供代码提示和补全功能,提高编程效率。在交互模式下,通过特定的交互Prompt和用户输入,支持智能问答、代码解释和安全检测。

插件还提供自动添加注释、代码优化与审计、代码格式检查、性能评估和测试用例生成等功能,以提高代码质量和性能。

CodeShell团队还发布了代码助手能力的统一评估基准,并将其开源,加入到CodeShell的开源生态中。这一举措将进一步提高编程的效率和质量,为开发者提供更多工具和支持。CodeShell的开源项目将有望改善编程体验,让代码编写更加高效和便捷。

0000
评论列表
共(0)条