IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型
划重点:
🔍 IBM 发布了一套名为 "Granite Code" 的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。
🔍 Granite Code 模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。
🔍 IBM 计划定期更新这些模型,并很快推出具有更大上下文窗口和针对 Python 和 Java 的专业化版本。
IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。
Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。
基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。
指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。
在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过谷歌最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。
这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。
IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。
IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。
产品入口:https://top.aibase.com/tool/granite-code-models
谷歌 25 岁生日:搜索引擎彻底改变人们获取信息的方式 正努力成为生成式人工智能经济的一部分
站长之家(ChinaZ.com)9月4日消息:今天是互联网历史上的一个重要里程碑:谷歌的25岁生日。每天提交的搜索查询数以亿计,现在很难想象没有搜索引擎我们是如何生活的。谷歌周一迎来了25岁生日,它已经从SusanWojcicki(未来的YouTube首席执行官)的车库诞生为一个搜索引擎,在生成式人工智能、聊天机器人和社交媒体等新型技术领域取得了长足发展。站长网2023-09-04 09:20:490000我国网购用户规模超9亿人:90后网购使用率超95%
站长之家(ChinaZ.com)6月28日消息:据央视新闻报道,中国互联网络信息中心(CNNIC)今日发布了《互联网助力数字消费发展蓝皮书》,揭示了我国数字消费市场的蓬勃发展态势。蓝皮书数据显示,我国网络购物用户规模已突破9亿人,其中购买国货潮品的用户规模达5.3亿,占比接近六成。这一数字不仅展示了中国网络购物的巨大潜力,也反映了消费者对国货品牌的日益青睐。站长网2024-06-29 16:22:440000Google 推出 AI Studio:开发者可基于其 Gemini 模型开发应用程序和聊天机器人
Google今天推出了一系列新的和更新的服务,将其Gemini模型系列带入开发者社区。其中一项服务是AIStudio,此前被称为MakerSuite。0005手机打工人,都去造车了
越来越多的手机厂员工,正在涌向车企。从一线敲代码的程序员,到经验丰富的产品经理,到熟悉营销的市场高管,纷纷从手机厂跳槽,去车企抢抓下一个风口。行业里最新的一次人事变动,是有着“美女产品经理”之称的宋紫薇,从vivo旗下子品牌iQOO离职加入理想汽车。这个话题登上了微博热搜。站长网2023-09-24 10:01:590001文本到3D生成评估器GPTEval3D 让GPT-4对生成的3D模型打分
GPTEval3D提供了一个用于评估文本到3D生成模型性能的评估指标。利用OpenAI和PyTorch,它通过ELO评分系统提供了一个全面的框架,用于评估文本到3D生成模型的性能。站长网2024-01-10 10:08:220003