码农编码利器ChatCoder:通过与LLM聊天来细化需求
站长网2023-11-16 14:42:100阅
大模型代码生成能力如何,还得看你的「需求表达」好不好。从通过HumEval中67%测试的GPT-4,到近来各种开源大模型,比如CodeLlama,有望成为码农编码利器。
然而,现实中,程序员们不会精炼表达需求,因此误导、限制了LLM生成优秀代码的能力。
为了解决大模型代码生成的需求表达问题,北大实验室的研究团队提出了通过与LLM聊天来细化需求的方法——ChatCoder。
论文地址:https://arxiv.org/pdf/2311.00272.pdf
ChatCoder通过聊天来辅助LLM和人类在需求细化方面的协作,从而提高大模型生成满足用户需求的代码。
ChatCoder的框架分为两个阶段:Paraphrase和Exend,以及Going-deep和Loop-back。在Paraphrase和Exend阶段,LLM根据用户的需求提示进行解释,并扩展假设。在Going-deep和Loop-back阶段,LLM向用户询问问题,解决需求细化中的困惑,并得到用户纠正后的规范。
经过两轮细化后,LLM生成满足用户需求的程序。
ChatCoder的评估结果显示,通过需求细化,ChatCoder帮助LLM提高了代码生成的执行精度。在Saniticed-MBPP上,ChatCoder带来了14%的性能提升。同时,ChatCoder的三种通信方法都对改进代码生成结果起到了作用。
人工干预在ChatCoder中扮演着重要的角色,因为需求细化需要揭示需求的内部结构和解决歧义。通过ChatCoder这种通过聊天进行需求细化的方法,可以提高大模型代码生成的能力,使其更好地满足用户需求。
0000
评论列表
共(0)条相关推荐
FF宣布重获纳斯达克上市合规计划 继续推进中东战略融资
今日,FaradayFuture(FF)宣布重获纳斯达克上市合规的计划。其董事会已批准一系列提案,其中包括实施公司普通股反向股票分割,该提案将在即将召开的年度股东大会上提交给股东审批。根据提案,现有公司已发行普通股和被授权普通股总数按1:2至1:40范围内的进行同比例反向分割授权。最终比例将在股东批准后由董事会决定,董事会有权选择放弃、延迟或推迟反向股票分割。站长网2024-06-25 15:18:360000首席分析师揭秘爆火Groq,每小时要烧168美元!10倍H100拥有成本,老黄笑而不语
【新智元导读】SemiAnalysis的行业专家对最近爆火的Groq推理系统进行了像素级的拆解,测算出其持有成本依然高达现有H100的10倍,看来要赶上老黄的步伐,初创公司还有很多要做。最近爆火的AI初创公司Groq,推出了比目前常见GPU推理系统快4倍,成本低70%的大模型推理解决方案。站长网2024-02-26 18:12:370001抖音上线“粉丝抹除、限制关注”功能
抖音今日发布了关于关于上线“粉丝抹除、限制关注”功能的公告。公告称,为规范用户行为,治理不当获取粉丝的账号,建设更加真实美好的社区生态,抖音根据《互联网用户账号信息管理规定》《抖音社区自律公约》等法律及平台规则,制定《抖音违规涨粉治理规范》,并将于2023年7月3日起正式生效。站长网2023-06-30 01:35:040001涨价,是大厂给共享单车亮出的一张“黄牌”
降本增效的大刀紧随其后。以前骑一次一块钱、五毛钱甚至不要钱的共享单车,现在要多少钱?对于部分城市的用户而言,新的收费标准是:每小时六块五。2023年以来,主要共享单车品牌相继在成都、厦门等城市调价。有用户抱怨,如今的共享单车价格已贵过公交,直追地铁。去年上半年,共享单车企业已经历过一轮涨价潮。那轮涨价过后,不购买套餐卡情况下,部分城市共享单车价格已高达6.5元1小时。站长网2023-06-12 23:35:280000写钓鱼邮件、开发恶意软件、伪造信用卡,AI机器人FraudGPT在暗网风靡
FraudGPT是一种不受监管的聊天机器人,在暗网上流通,并被犯罪分子用来编写网络钓鱼电子邮件和开发恶意软件。Netenrich研究员RakeshKrishnan表示:“随着生成式人工智能模型的兴起,威胁形势发生了巨大变化。”最近,Netenrich的研究团队在Darknet论坛等中发现了名为FraudGPT的软件的证据。站长网2023-07-31 10:32:030000