首页站长资讯华为云研究团队提出 PanGu-Coder2 模型和 RRTF 框架提升大模型性能

华为云研究团队提出 PanGu-Coder2 模型和 RRTF 框架提升大模型性能

站长网2023-08-01 09:57:541阅

华为云、中国科学院和北京大学的研究人员最近提出了一种名为 RRTF（Rank Responses to align Test&Teacher Feedback）的新框架，能够有效地提升预训练的大型语言模型(LLM)在代码生成方面的性能。RRTF 框架通过自然语言 LLM 对齐技术和排名反馈的方式来改进代码生成 LLM 的表现。研究团队还引入了 PanGu-Coder2模型，该模型在 OpenAI HumanEval 基准测试中取得了出色的62.20% 的通过率。

论文地址:https://arxiv.org/abs/2307.14936

该研究通过在 StarCoder15B 上应用 RRTF 框架，超越了 PanGu-Coder 并获得了所有记录的代码 LLM 中最佳性能，证明了 RRTF 的有效性。对三个基准测试（HumanEval、CoderEval 和 LeetCode）的全面分析表明，代码 LLM 在代码生成任务中可能能够超过相同或更大规模的自然语言模型。研究还强调了高质量数据对提高模型遵循指令和编写代码能力的价值。

贡献:

1. RRTF 框架是一个模型中立、简单且高效的优化方法，可以提高代码 LLM 的性能。

2. PanGu-Coder2模型比其原始模型提高了约30%，在 HumanEval、CoderEval 和 LeetCode 等基准测试中表现出色。

3. PanGu-Coder2在代码生成方面超过了所有先前发布的代码 LLM，达到了最新的最佳性能。

4. 研究团队提供了关于构建用于代码生成的良好训练数据的想法和实践知识。

5. PanGu-Coder2模型是使用 RRTF 框架训练的，并提供了有关此过程的有用见解。

6. 除了提高代码生成效率外，研究团队还建议了 PanGu-Coder2使用的优化方法，以确保快速推理，这对于实际应用非常重要。

华为云研究团队提出PanGuCoder2模型和RRTF框架 提升大模型性能

0001

评论列表

共(0)条

相关推荐

站长资讯
暗黑版GPT流窜暗网降低犯罪门槛
随着AIGC应用的普及，不法分子利用AI技术犯罪的手段越来越高明，欺骗、敲诈、勒索也开始与人工智能沾边。近期，专为网络犯罪设计的“暗黑版GPT”持续浮出水面，它们不仅没有任何道德界限，更没有使用门槛，没有编程经验的小白能通过问答的方式实施黑客攻击。AI犯罪的威胁离我们越来越近，人类也开始加筑新的防火墙。网络犯罪AIGC工具现身暗网
站长网2023-08-08 09:16:41
0000
站长资讯
教育大厂“不务正业”，AI社交出海巴西、拿下近600万月活
今年春天，a16z发布了《Top100生成式AI消费（ToC）类应用》报告，里面一共提及了两款进入移动端MAU前50的AI社交产品，一款是Character.AI，另一款是Poly.AI，而后者已被证实来自国内在线教育厂商作业帮。图源:《Top100生成式AI消费（ToC）类应用》报告
站长网2024-07-27 15:24:40
0001
站长资讯
理想汽车在深圳成立科技公司含AI应用软件开发业务
天眼查App显示，8月22日，深圳车和家科技有限公司成立，法定代表人为张如良，注册资本100万人民币，经营范围含大数据服务、人工智能基础软件开发、人工智能应用软件开发、云计算装备技术服务、汽车零配件批发、汽车零配件零售、企业管理咨询等。股东信息显示，该公司由北京理想汽车有限公司全资持股。
站长网2023-08-24 23:31:49
0000
站长资讯
抖音：即日起抖音VR直播在苹果Vision Pro支持下载体验
今日，抖音集团在微信公众号上宣布，其最新推出的抖音VR直播功能现已在AppleVisionPro平台上线，供用户下载体验。这项技术革新带来了全新的观看体验:通过小范围6DoF技术，观众的视线所及之处，内容都能实时追随，无论从哪个角度观看，都能享受到超清的正面视角。3D直播技术让画面突破传统屏幕限制，与现实世界无缝融合，为用户带来前所未有的立体观看体验。
站长网2024-07-11 08:54:22
0000
站长资讯
Tromzo获得800万美元融资，引领AI应用程序安全态势管理
本文概要:1.美国网络安全初创公司Tromzo获得800万美元种子轮融资。2.Tromzo的平台利用人工智能和智能图谱来提供终端到终端的可见性，减少噪音，消除手动工作，提高安全拥有度。3.Tromzo的独特方法结合了人工智能和应用安全态势管理（ASPM）。
站长网2023-08-04 14:47:03
0000