Hugging Face发布新开源编程大语言模型StarCoder :可自动写代码、根据指令改代码
企业工作流公司 ServiceNow 和 ML 工具开发商 Hugging Face 开发了一种用于编码的开源大型语言生成 AI 模型——StarCoder LLM。
这是一个150亿参数的模型,旨在为开放式人工智能研究社区负责任地生成代码。StarCoder 是 ServiceNow 和 Hugging Face 研究人员采用StarCoderBase模型的结果,该模型根据来自 GitHub 的许可数据进行训练,涵盖80多种编程语言,并在350亿个 Python token上对其进行微调。

据称,StarCoder LLM模型优于现有的开放代码生成模型以及封闭模型,例如 OpenAI 的 code-cushman-001,这是为早期版本的GitHub Copilot提供支持的原始Codex模型。
根据 ServiceNow 和 Hugging Face 的说法,该模型拥有超过8,000个token的上下文长度,这意味着它可以处理大量输入,从而“启用各种有趣的应用程序”。
Hugging Face 研究人员在一篇博文中解释说:“例如,通过用一系列对话提示 StarCoder 模型,我们让它们充当技术助手。此外,还可用于自动完成代码、通过指令修改代码以及用自然语言解释代码片段。”
StarCoder 与几个类似的模型进行了比较,包括 Google 的PaLM和LaMDA以及 Meta 的LLaMA。使用包括 HumanEval 在内的多个基准对模型进行了评估。

尽管体积小得多,但研究人员发现 StarCoder 和底层的 StarCoderBase 都优于其竞争对手。
该团队还观察到,通过强制模型生成实际的编码解决方案,它提高了性能得分。据其背后的研究团队称,StarCoder 还在多语言基准测试 MultiPL-E 上进行了测试,并取得了同样令人印象深刻的结果。
StarCoder 在 Hugging Face 宣布其已开发开源版本的 ChatGPT“ Hugging Chat”之后发布的。
StarCoder LLM网址:https://huggingface.co/bigcode/starcoder
存储库:bigcode/Megatron-LM
项目网站:bigcode-project.org
Hugging Chat网址:https://huggingface.co/chat/
小米YU7冬测!雷军、卢伟冰现身黑河:一起放加特林烟花
快科技1月12日消息,今日,抖音网友不会开车的杨桃”发布视频作品,称在生日这天最牛的活动是和雷总一起放烟花。作品显示,该视频拍摄于1月11日,地点位于黑龙江省黑河市,小米CEO雷军、小米总裁卢伟冰、小米战略市场部副总经理徐洁云等人现身,在一处空地放加特林”烟花。在这条视频作品的评论区,还有网友晒出雷军一行人在黑河逛俄罗斯商品街的照片。站长网2025-01-12 11:26:460000一键消除视频人物!南科大发布视频分割模型TAM 支持动态物体追踪
特效师的救星来了!近日,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。TAM可应用于视频编辑、虚拟现实、增强现实等领域,具备广泛的应用前景。TAM的出现也将促进视频内容的真实性和可信度,减少一些虚假信息的传播。站长网2023-05-04 18:11:380000新春开工AIGC领域就业需求暴增 同比增长6倍
猎聘大数据研究院最新发布的《2024新春开工首周就业洞察报告》揭示了一个令人瞩目的趋势:随着人工智能与图形计算领域的新星OpenAISora的涌现,相关行业的就业需求呈现出了惊人的增长。根据猎聘大数据显示,与去年相比,AIGC领域相关职位数量增长了惊人的612.5%!更令人瞩目的是,这些职位的平均年薪高达44.37万元,吸引了大量求职者的目光。站长网2024-02-27 15:40:190000钱花不出去?尽管97%企业表示加大或维持工具预算
先看组数据,见实工具大调研中,有97%的企业表示会维持或加大工具预算,另外仅有2.9%的企业选择减少投入。这组数据明示着:现阶段工具的效率和价值被广泛认可,未来需求也将不断增长。相对应的是,随着私域收入不断提升、占比和贡献不断提升,企业的工具预算在实时提升。如果单看企业的付费意愿和需求,那是相当的慷慨。但,另一面是企业也一直在苦恼无法找到好的工具。站长网2024-05-04 17:36:4200012024北京国际车展展位图公布:小米、智己“冤家聚头”
快科技4月20日消息,2024(第十八届)北京国际汽车展览会将于2024年4月25日-5月4日在中国国际展览中心顺义馆、朝阳馆举办,官方现已公布各品牌展位图。其中顺义馆为各大汽车品牌参展场馆,主要的展馆集中在E1-E4以及W1-W4之间,这八个馆将会是主要的展台。公众展示时间4月27日起-5月4日,4月25-26日为展会新闻日,专门接待到场参观采访报道的海内外新闻媒体记者。站长网2024-04-20 10:14:270000