IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型
划重点:
🔍 IBM 发布了一套名为 "Granite Code" 的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。
🔍 Granite Code 模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。
🔍 IBM 计划定期更新这些模型,并很快推出具有更大上下文窗口和针对 Python 和 Java 的专业化版本。
IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。
Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。

基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。
指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。
在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过谷歌最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。
这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。
IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。
IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。
产品入口:https://top.aibase.com/tool/granite-code-models
京东:快递小哥中三年收入超百万的已达近百人
今日,京东官方发文称,京东物流为员工提供了全员“五险一金”以及多项福利政策,使得京东员工在退休后能够享受有保障的生活。近年来,不少京东快递、客服、仓储、车队等基层一线员工退休,他们每月领取养老金,过上了有保障的退休生活。京东快递小哥中,有近百人的三年收入超过百万元,甚至在广东潮汕地区有小哥的三年收入超过200万元。站长网2024-01-18 10:13:310000苹果被曝取消电动汽车项目 将专注于生成式人工智能研发
近日,据彭博社报道,苹果公司决定搁置并取消其长期投入的自动驾驶电动汽车项目。此项目自启动以来已有十多年的历程,耗资数百万美元,但最终公司高层认为该项目并不可行。站长网2024-02-28 08:05:090000时代的传奇 乔布斯去世12周年 库克发文:我们想念你
快科技10月6日消息,不知不觉间,有着苹果教主之称的史蒂夫乔布斯已经去世整12年。他在苹果公司推出iPhone4S和Siri一天后去世,享年56岁。苹果现任首席执行官蒂姆?库克在X(推特)平台发布推文怀念乔布斯,他在推文中写道:缅怀一位勇于挑战传统的先驱者、一位改变世界的远见者、一位人生中的导师和一位我的挚友。我们想念你,史蒂夫”。站长网2023-10-06 09:48:360000进军TikTok,小杨哥公司要赚外国人的钱了
互联网的奇妙在于,前一刻还默默无闻,后一刻就家喻户晓。“疯狂小杨哥”的名字大家肯定不陌生,从2018年在抖音崭露头角到现在成为头部主播,从土味搞笑视频博主到成为直播带货的网络红人,获得了不俗的成绩。站长网2024-01-24 09:26:490000西交大开源SadTalker模型 图片+音频秒变视频!
最近,西安交通大学的研究人员提出了SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片音频就能生成高质量的视频。站长网2023-04-19 15:34:550001