IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型
划重点:
🔍 IBM 发布了一套名为 "Granite Code" 的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。
🔍 Granite Code 模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。
🔍 IBM 计划定期更新这些模型,并很快推出具有更大上下文窗口和针对 Python 和 Java 的专业化版本。
IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。
Granite Code 型分为基础模型和指导模型,每种模型都有四个不同规模的变种,参数数量从30到340亿不等。这些模型的上下文窗口相对较短,例如,其中一个模型的上下文窗口只有128K,这限制了其在包含特定文档或自己的代码库等提示信息时的有效性。不过,IBM 目正在开发具有更大上下文窗口的版本。

基础模型的训练分为两个阶段。第一阶段使用自116种编程语言的3-4万亿个标记进行训练,以建立广泛的理解能力。在第阶段,这些模型使用来自高质量代码和自然语言数据的5000亿个标记进行进一步训练,以强逻辑推理能力。
指导模型是通过对基础模型进行改进而创建的,改进方法包括筛选提交记录、自然语言指令记录和合成生成的代码数据集。
在包括代码合成、调试、解释、编辑、学推理等多个基准测试中,Granite Code 模型在各个规模和基准测试中表现出色,常常超过开源模型两倍以上的大小。例如,在 HumanEvalPack 基准测试中,Granite-8B-Code-Base 的平均得为33.2%,超过谷歌最佳表现的 CodeGemma-8B 模型的21.3%,尽管 Granite-8-Code-Base 所使用的标记数量明显较少。
这些模型的大部分训练数据来自一个清理过的 GitHub 集 StarCoderData 和其他公开可用的代码库。这一点非常重要,因为目前有一些关于其他代码型(包括 GitHub 本身)涉嫌侵犯训练数据版权的诉讼。
IBM 计划定期更新这些模型,很快将推出具有更大上下文窗口以及针对 Python 和 Java 的专业化版本。这些模型已经在 Hugging FaceGitHub 上可用,并且也是 IBM 的 watsonx 企业平台的一部分。
IBM 的 Granite Code 是一专门用于编程的开源模型,它们在基准测试中表现优异,同时具有较少的参数数量。些模型的特点包括灵活的规模选择、基于广泛训练数据的逻辑推理能力和良好的性能未来,IBM 还计划不断改进和更新这些模型,以满足不同编程任务的需求。
产品入口:https://top.aibase.com/tool/granite-code-models
谁在为“雪季”买单?
12月10日夜,北京迎来今冬第一场大雪。打工人盼雪的心情,似乎比过年还兴奋。截至12月11日16时,市属公园接待雪中赏景游客超过10万人。比北京大雪来得更早一步的,是2023年的滑雪季。11月以来,国内各旅游目的地室外滑雪场已经集中开板。第一批滑雪玩家早已争先恐后地挤满了各个雪场,他们身着鲜艳的滑雪服,手持雪杖,脚踏雪板,从雪道上飞驰而过,尽情享受着冰雪带来的速度与激情。站长网2023-12-13 22:09:130000抖音国际注册功能开放?官方尚未回应,知情人士澄清信息不实
近日,有媒体报道称,抖音目前已开放国际注册功能,多个国家的用户在抖音上分享的视频显示其IP属地为美国、英国、俄罗斯、泰国等地。同时,抖音手机号注册页面也显示了全球多个国家的国际电话区号供选择。这一变化引发了外界对抖音是否正式开放国际用户注册的广泛关注。0000比对口型还牛!InstructAvatar:实现文字生成指定面部的表情和动作
划重点:🔍最新的对话形象生成模型在实现与音频的逼真准确的唇同步方面取得了进展,但在控制和传达形象的细节表情和情感方面仍有不足。🔍InstructAvatar提供了对情感和面部动作进行细粒度控制的文本引导方法,为生成具有情感表达的2D虚拟形象提供了改进的互动性和泛化能力。站长网2024-05-28 19:35:420000小米双11今晚8点开启:手机产品最高优惠1000元
小米公司今日宣布,“小米双11科技狂欢季”将于今日晚上8点正式拉开帷幕。这场为期数周的购物盛典将推出多达50款新品,其中手机产品的最高优惠将达到1000元,而部分单品的特惠幅度更是高达3000元。0000智源研究院开源JudgeLM 可评测各类大模型并输出评分
智源研究院开源了一种名为JudgeLM的裁判模型,可以高效准确地评判各类大模型。与GPT-4相比,JudgeLM仅需1/120的成本,就能达到90%以上的评判结果一致性。它可以应用于纯文本、多模态等多种评判场景,并可以输出评分、判断和阐述理由。站长网2023-11-13 21:44:480000