Hugging Face发布新开源编程大语言模型StarCoder :可自动写代码、根据指令改代码
企业工作流公司 ServiceNow 和 ML 工具开发商 Hugging Face 开发了一种用于编码的开源大型语言生成 AI 模型——StarCoder LLM。
这是一个150亿参数的模型,旨在为开放式人工智能研究社区负责任地生成代码。StarCoder 是 ServiceNow 和 Hugging Face 研究人员采用StarCoderBase模型的结果,该模型根据来自 GitHub 的许可数据进行训练,涵盖80多种编程语言,并在350亿个 Python token上对其进行微调。
据称,StarCoder LLM模型优于现有的开放代码生成模型以及封闭模型,例如 OpenAI 的 code-cushman-001,这是为早期版本的GitHub Copilot提供支持的原始Codex模型。
根据 ServiceNow 和 Hugging Face 的说法,该模型拥有超过8,000个token的上下文长度,这意味着它可以处理大量输入,从而“启用各种有趣的应用程序”。
Hugging Face 研究人员在一篇博文中解释说:“例如,通过用一系列对话提示 StarCoder 模型,我们让它们充当技术助手。此外,还可用于自动完成代码、通过指令修改代码以及用自然语言解释代码片段。”
StarCoder 与几个类似的模型进行了比较,包括 Google 的PaLM和LaMDA以及 Meta 的LLaMA。使用包括 HumanEval 在内的多个基准对模型进行了评估。
尽管体积小得多,但研究人员发现 StarCoder 和底层的 StarCoderBase 都优于其竞争对手。
该团队还观察到,通过强制模型生成实际的编码解决方案,它提高了性能得分。据其背后的研究团队称,StarCoder 还在多语言基准测试 MultiPL-E 上进行了测试,并取得了同样令人印象深刻的结果。
StarCoder 在 Hugging Face 宣布其已开发开源版本的 ChatGPT“ Hugging Chat”之后发布的。
StarCoder LLM网址:https://huggingface.co/bigcode/starcoder
存储库:bigcode/Megatron-LM
项目网站:bigcode-project.org
Hugging Chat网址:https://huggingface.co/chat/
MathVerse:全方位可视化数学基准,对多模态大型语言模型进行公平和深入的评估
划重点:🔍MLLMs在视觉情境下的表现异常出色,但解决视觉数学问题的能力仍需全面评估和理解。🔍MATHVERSE提出了一个创新性的基准,旨在严格评估MLLMs在解释数学问题中的视觉信息理解能力。🔍研究发现大多数现有模型需要视觉输入来理解数学图表,甚至可能表现更好,这表明需要更先进的数学专用视觉编码器。站长网2024-03-26 17:37:300000理想AD Max 3.0上热搜 将在本季度开启内测
今日,理想汽车宣布进入“双能战略”的发展新阶段,在“智能”和“电能”方面全面发力。到2025年,理想汽车将形成“1款超级旗舰5款增程电动车型5款高压纯电车型”的产品布局,面向20万以上的市场,全面满足家庭用户需求。站长网2023-04-18 10:37:080001到处都是知识演员,怎么避免被割韭菜?
2017年,在当时的网络语境下被认为“油腻”、“拧巴”、“落后于时代”的单向街书店的创办人许知远,开启了人物访谈节目《十三邀》的第二季,第一个嘉宾采访了米未传媒的创始人马东。当时的马东因为做了《奇葩说》这档节目,风头正劲,被认为是继罗振宇之后,对知识的传播开启了一种新的商业模式。在《十三邀》的第一季第一集,许知远带着一种传统知识分子的偏见,采访了罗振宇。0000世界顶级人工智能研究人员齐聚非洲就 AI 技术的未来走向展开辩论
上周,来自世界各地的2000多名研究人员和工程师聚集在卢旺达,就人工智能的未来走向展开竞争性的辩论。一方面,他们拟建更强大的系统,如ChatGPT,旨在超越人类智能,提高工人生产率并增加经济增长;另一方面,也有人拟建更小型,更有针对性的人工智能解决方案,以应对全球性的挑战,如气候变化、改善医疗保健和保护生物多样性。站长网2023-05-08 10:28:320000斯坦福提出“统一归因”框架 保证大模型输出的真实性和可靠性
随着大型语言模型在实际业务中的广泛应用,确保其输出的真实性和可靠性成为亟待解决的问题。学术界采用“归因”方法来追踪和证实模型输出的内容。当前研究领域主要分为两大派系,即协同归因和贡献归因。前者关注验证大模型输出的正确性,后者用于确定训练数据对模型输出的影响程度。在法律、医疗、金融等领域,对内容准确性有高要求的行业,这两种方法至关重要。站长网2023-12-21 09:43:380002