华为云研究团队提出 PanGu-Coder2 模型和 RRTF 框架 提升大模型性能
华为云、中国科学院和北京大学的研究人员最近提出了一种名为 RRTF(Rank Responses to align Test&Teacher Feedback)的新框架,能够有效地提升预训练的大型语言模型(LLM)在代码生成方面的性能。RRTF 框架通过自然语言 LLM 对齐技术和排名反馈的方式来改进代码生成 LLM 的表现。研究团队还引入了 PanGu-Coder2模型,该模型在 OpenAI HumanEval 基准测试中取得了出色的62.20% 的通过率。
论文地址:https://arxiv.org/abs/2307.14936
该研究通过在 StarCoder15B 上应用 RRTF 框架,超越了 PanGu-Coder 并获得了所有记录的代码 LLM 中最佳性能,证明了 RRTF 的有效性。对三个基准测试(HumanEval、CoderEval 和 LeetCode)的全面分析表明,代码 LLM 在代码生成任务中可能能够超过相同或更大规模的自然语言模型。研究还强调了高质量数据对提高模型遵循指令和编写代码能力的价值。
贡献:
1. RRTF 框架是一个模型中立、简单且高效的优化方法,可以提高代码 LLM 的性能。
2. PanGu-Coder2模型比其原始模型提高了约30%,在 HumanEval、CoderEval 和 LeetCode 等基准测试中表现出色。
3. PanGu-Coder2在代码生成方面超过了所有先前发布的代码 LLM,达到了最新的最佳性能。
4. 研究团队提供了关于构建用于代码生成的良好训练数据的想法和实践知识。
5. PanGu-Coder2模型是使用 RRTF 框架训练的,并提供了有关此过程的有用见解。
6. 除了提高代码生成效率外,研究团队还建议了 PanGu-Coder2使用的优化方法,以确保快速推理,这对于实际应用非常重要。
内部人士透露:OpenAI 很可能将 GPT-3.5 开源
OpenAI很可能在未来几个月内发布其模型的权重。OpenAI的AndrejKarpathy最近表示,所有这些对于转换器语言模型来说都是非常通用的。“如果/当OpenAI发布模型权重(我既不能确认也不能否认!),那么这里的大部分代码将非常相关。”站长网2023-07-26 09:59:200000天猫618首小时:苹果拿下15亿!华为、小米、vivo均破亿
快科技5月20日消息,今年的天猫618大促,取消了漫长的预售环节,5月20日晚8点直接现货开卖,堪称最简单实惠的一届618。在手机数码领域,618一开场,就立刻火爆起来。官方数据显示,天猫618开售的第一个小时内,苹果的成交金额就超过了15亿元,遥遥领先,同时华为、小米、vivo等品牌的成交额也迅速突破1亿元。站长网2024-05-21 10:53:180000一次拿下10亿美金融资,杨植麟和月之暗面要放开手脚了
月之暗面,拿到了中国大模型初创公司自ChatGPT出现至今的最大一笔单轮融资,10亿美元。据36氪获悉,这轮新的融资动作在近日完成,投资方包括从天使轮就已进场的红杉中国,以及首次露面的小红书、美团和阿里巴巴。从去年年初攥着5000万美金入局,到去年10月拿到老股东红衫中国领投的近3亿美元的新一轮融资,再到这笔10亿美元融资完成,月之暗面估值已接近25亿美金。站长网2024-02-20 17:22:190000研究发现,ChatGPT 能理解和回应人类情感
划重点:-研究发现,ChatGPT能理解和回应人类情感,当提示中包含情感因素时,聊天机器人的回答效果更好。-该研究表明,LLMs(大型语言模型)如ChatGPT可能能够“理解和回应情感暗示”。-如果ChatGPT确实能够理解人类情感,并且在提示中包含情感角度时能够更好地回应,那么我们可能离AGI更近一步了。站长网2023-11-16 17:55:550000谷歌解雇整个Python团队!PyTorch创始人直呼“WTF”
快科技4月28日消息,据媒体报道,日前谷歌Python工程师、Python指导委员会成员ThomasWouters在社交媒体上发布了一条消息,称谷歌解雇了Python团队。此消息一出就惊动了领域内的很多开发者,PyTorch创始人、Meta杰出工程师SoumithChintala表示:“显然谷歌解雇了整个Python基础团队,WTF!”0000