ChatGPT回答编程问题的准确率比抛硬币还要差
站长网2023-08-08 15:40:120阅
本文概要:
1. 普渡大学研究发现,ChatGPT 在软件编程问题上的准确率不到五成。
2. ChatGPT 的答案虽然经常是错误的,但由于其全面性和清晰的语言风格,仍然具有欺骗性。
3. ChatGPT 的答案更容易犯概念错误,但在情绪表达上比 Stack Overflow 的答案更积极。
根据普渡大学的一项研究,OpenAI 的聊天机器人 ChatGPT 在超过一半的时间里对软件编程问题给出了错误的答案。
该研究分析了 ChatGPT 对517个 Stack Overflow 的问题的回答,以评估 ChatGPT 答案的正确性、一致性、全面性和简洁性。结果发现,52% ChatGPT 给出的答案是错误的,77% 的答案是冗长的。
值得注意的是,ChatGPT 的全面性和清晰的语言风格使其仍然具有欺骗性。研究人员表示,当错误不易验证或需要外部 IDE 或文档时,参与者往往无法识别错误或低估答案中的错误程度。由于其全面性和清晰的语言风格,ChatGPT 答案在39.34% 的情况下仍然受到青睐。
该论文指出,即使答案存在明显错误,12名参与者中仍有两人仍将首选答案标记为首选。论文将此归因于 ChatGPT 令人愉快、权威的风格。
此外,研究还发现 ChatGPT 的答案更容易犯概念错误,但在情绪表达上比 Stack Overflow 的答案更积极。
0000
评论列表
共(0)条相关推荐
华为云发布盘古具身智能大模型:“夸父”人形机器人亮相
快科技6月21日消息,在今天的华为开发者大会上,华为云还发布了盘古大模型5.0,以及盘古具身智能大模型。盘古具身智能大模型是人形机器人的灵魂,会上还展示了乐聚公司搭载该模型的夸父”人形机器人。据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。站长网2024-06-22 23:42:140000超过一半的投资者愿意采纳AI提供的投资建议
文章概要:1.超过半数投资者在某些情况下愿意接受人工智能提供的投资建议。2.老年投资者相比年轻投资者更倾向于接受人工智能提供的投资建议。3.只有很小一部分投资者愿意直接执行人工智能提供的建议,大多数投资者仍希望由人类投资顾问过目。最近一项调查显示,超过半数的投资者在某些情况下愿意接受人工智能系统提供的投资建议,只要这些建议能够由金融顾问过目。站长网2023-08-26 16:12:100000Brilliant Labs融资300万美元,开发基于生成式AI的AR眼镜
🔍划重点:1.:BrilliantLabs成功融资300万美元,用于开发其基于生成AI的增强现实眼镜。2.公司推出了重新命名的生成AI应用Noa,此前称为arGPT,以及将开源视觉AI模型StabilityAI整合到其旗舰AR设备Monocle中。3.BrilliantLabs与WayfarerFoundation正在引领头戴AI设备的伦理框架开发,为该行业树立了新的先例。站长网2023-10-25 12:56:340000LinkedIn分析显示苹果员工最有可能跳槽加入谷歌
根据对科技行业LinkedIn个人数据的分析显示,苹果前员工最喜欢的目的地是谷歌。这一分析结果揭示了科技行业的动态变化,尽管苹果员工很可能来自英特尔、微软或亚马逊等公司。站长网2023-11-24 09:59:180000字节回应收缩游戏业务:保留部分创新型游戏项目
据澎湃新闻报道,针对“大规模收缩游戏业务”一事,字节跳动旗下朝夕光年方面回应称,朝夕光年确实将进行大规模业务收缩:对已上线的且表现良好的游戏,会在保证运营的情况下寻求剥离;对还未上线的项目,除少量创新项目及相关技术项目外,均会关停。朝夕光年还表示,游戏业务确实会有方向和组织调整,将更加聚焦部分创新型游戏及相关技术的探索。但同时,也会做好已上线产品的持续运营,充分保障玩家的权益。站长网2023-11-27 14:17:450000