ChatGPT回答编程问题的准确率比抛硬币还要差

站长网2023-08-08 15:40:120阅

本文概要:

1. 普渡大学研究发现，ChatGPT 在软件编程问题上的准确率不到五成。

2. ChatGPT 的答案虽然经常是错误的，但由于其全面性和清晰的语言风格，仍然具有欺骗性。

3. ChatGPT 的答案更容易犯概念错误，但在情绪表达上比 Stack Overflow 的答案更积极。

根据普渡大学的一项研究，OpenAI 的聊天机器人 ChatGPT 在超过一半的时间里对软件编程问题给出了错误的答案。

该研究分析了 ChatGPT 对517个 Stack Overflow 的问题的回答，以评估 ChatGPT 答案的正确性、一致性、全面性和简洁性。结果发现，52% ChatGPT 给出的答案是错误的，77% 的答案是冗长的。

值得注意的是，ChatGPT 的全面性和清晰的语言风格使其仍然具有欺骗性。研究人员表示，当错误不易验证或需要外部 IDE 或文档时，参与者往往无法识别错误或低估答案中的错误程度。由于其全面性和清晰的语言风格，ChatGPT 答案在39.34% 的情况下仍然受到青睐。

该论文指出，即使答案存在明显错误，12名参与者中仍有两人仍将首选答案标记为首选。论文将此归因于 ChatGPT 令人愉快、权威的风格。

此外，研究还发现 ChatGPT 的答案更容易犯概念错误，但在情绪表达上比 Stack Overflow 的答案更积极。

ChatGPT回答编程问题的准确率比抛硬币还要差

0000

评论列表

共(0)条

相关推荐

站长资讯
苹果所创造的各种iPhone之最——看看哪代水果手机最经典
（一）乔布斯时代这是苹果的第二代iPhone，发布于2008年6月9日。这代搭载的iPhoneOS首次加入了AppStore(应用商店)，在软件生态上遥遥领先于同时代对手。因为在那个时候，安卓手机还没有问世，微软的WM系统和诺基亚的塞班系统则根本没有应用商店——这两者的应用商店要等到后面的版本才有。
站长网2023-05-24 04:03:41
0000
马斯克入选“失败博物馆”：给孩子起名字也失败了
凤凰网科技讯北京时间5月2日消息，俗话说“失败是成功之母”。瑞典有个别出心裁的“失败博物馆”就是为了向人们展示大量精选的失败案例，帮助人们从过去的错误中吸取教训，这其中就包括大名鼎鼎的特斯拉CEO埃隆马斯克(ElonMusk)。
站长网站长资讯2023-05-02 10:08:06
0000
站长资讯
时薪仅2美元心灵受重创，肯尼亚工人起诉要求调查OpenAI外包公司
本文概要:1.四名前ChatGPT劳工向肯尼亚政府请愿，要求调查OpenAI合作的内容审核公司Sama。2.前劳工声称在审核过程中遭受剥削和有害待遇，对心理健康造成持久影响。3.员工要求政府制定规定，保护从事有害和危险技术工作的人，并调查外包公司的滥用行为。
站长网2023-08-07 10:53:51
0000
站长资讯
英伟达收购人工智能初创公司 OmniML 押注边缘 AI
英伟达在今年2月悄悄收购了人工智能初创公司OmniML。OmniML的技术可以将机器学习模型小型化，使其能够在边缘设备上运行，而不依赖云端。一位发言人以及前OmniML员工的LinkedIn个人资料，他们现在都加入了英伟达。
站长网2023-07-05 10:22:09
0001
站长资讯
阿里巴巴张勇谈人工智能：有旧行业将消失新的行业也会涌现
在近日的2023阿里巴巴罗汉堂数字经济年会上，在谈到人工智能带来的挑战时，阿里巴巴张勇表示，“人工智能的发展可以类比移动互联网。目前所有行业，包括制造业、交通业、金融业等，都会在AI的加持下不断升级。虽然有一些行业和岗位可能会受到影响，但随着技术的不断落地，旧的行业将会消失，新的行业也会涌现。”
站长网2023-06-21 15:13:15
0000