码农编码利器ChatCoder:通过与LLM聊天来细化需求
站长网2023-11-16 14:42:100阅
大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。
然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。
为了解决大模型代码生成的需求表达问题,北大实验室的研究团队提出了通过与LLM聊天来细化需求的方法——ChatCoder。

论文地址:https://arxiv.org/pdf/2311.00272.pdf
ChatCoder通过聊天来辅助LLM和人类在需求细化方面的协作,从而提高大模型生成满足用户需求的代码。
ChatCoder的框架分为两个阶段:Paraphrase和Exend,以及Going-deep和Loop-back。在Paraphrase和Exend阶段,LLM根据用户的需求提示进行解释,并扩展假设。在Going-deep和Loop-back阶段,LLM向用户询问问题,解决需求细化中的困惑,并得到用户纠正后的规范。
经过两轮细化后,LLM生成满足用户需求的程序。
ChatCoder的评估结果显示,通过需求细化,ChatCoder帮助LLM提高了代码生成的执行精度。在Saniticed-MBPP上,ChatCoder带来了14%的性能提升。同时,ChatCoder的三种通信方法都对改进代码生成结果起到了作用。
人工干预在ChatCoder中扮演着重要的角色,因为需求细化需要揭示需求的内部结构和解决歧义。通过ChatCoder这种通过聊天进行需求细化的方法,可以提高大模型代码生成的能力,使其更好地满足用户需求。
0000
评论列表
共(0)条相关推荐
2.5亿美元!谷歌将购买部分HTC XR业务
快科技1月23日消息,据报道,谷歌将斥资2.5亿美元与HTC达成一项重要交易,其中部分HTC的XR研发团队精英将融入谷歌大家庭。根据协议条款,谷歌将获得HTC非专属的XR知识产权(IP)授权,这一战略合作的预计完成时间为2025年第一季度。此外,双方还表示将在协议签署后,积极探讨潜在的未来合作契机。0000加入 AI 功能的 Dynamics 成为微软增速最快的软件产品之一
站长之家(ChinaZ.com)8月4日消息:微软在2023财年的报告中未公布其云计算业务Azure的业务规模,但报告显示,微软的客户销售管理系统Dynamics成为增长速度最快的软件产品之一。站长网2023-08-04 15:02:510000半个月,1个亿:“秋冬三宝”卖爆抖音
“充绒量150g,绒子含量90%,穿着又蓬松又温暖。”“南方可以直接穿到深冬,北方零下10℃也没问题。”“这是我们今年的新款,等十月正式开卖就不是这个价了。”在每日最高温度接近40℃的盛夏,抖音直播间里却有很多主播裹着羽绒服,在镜头前卖力讲解。与此同时,直播间观众们也热情高涨,和主播积极互动,摩拳擦掌想要为还没到来的冬天“囤货”。站长网2024-08-21 17:27:410000AI性能旗舰魅族21 Note曝光!对标友商K70和Ace3
快科技4月23日消息,不久前魅族有一款型号为M468Q”的新机通过了3C认证,此前有消息称该机为魅族21X,不过根据最新消息,该手机预计为魅族21Note。数码博主数码闲聊站”今天透露,魅族备案新品不是网传的21X,市场名称预计叫魅族21Note,定位AI性能旗舰,在游戏和性能体验上完全对标友商(Redmi)K70和(一加)Ace3。站长网2024-04-23 15:12:430001阿里钉钉与华为达成合作 启动“钉钉鸿蒙版”开发
11月23日消息,钉钉与华为举办鸿蒙原生应用开发启动仪式,双方将在产业创新、技术应用、商业发展等领域全面合作,并正式启动“钉钉鸿蒙版”的开发。鸿蒙最新数据显示,截至今年8月份,鸿蒙生态设备数已超过7亿,开发者突破220万人。目前,钉钉上有超过6亿用户、2300万企业组织。钉钉自2023年4月以来,通过接入大模型已完成17个产品线、60多个场景的AI改造,目前有50多万家企业在使用钉钉AI。站长网2023-11-23 16:01:070000