ChatGPT回答编程问题的准确率比抛硬币还要差
站长网2023-08-08 15:40:120阅
本文概要:
1. 普渡大学研究发现,ChatGPT 在软件编程问题上的准确率不到五成。
2. ChatGPT 的答案虽然经常是错误的,但由于其全面性和清晰的语言风格,仍然具有欺骗性。
3. ChatGPT 的答案更容易犯概念错误,但在情绪表达上比 Stack Overflow 的答案更积极。
根据普渡大学的一项研究,OpenAI 的聊天机器人 ChatGPT 在超过一半的时间里对软件编程问题给出了错误的答案。
该研究分析了 ChatGPT 对517个 Stack Overflow 的问题的回答,以评估 ChatGPT 答案的正确性、一致性、全面性和简洁性。结果发现,52% ChatGPT 给出的答案是错误的,77% 的答案是冗长的。

值得注意的是,ChatGPT 的全面性和清晰的语言风格使其仍然具有欺骗性。研究人员表示,当错误不易验证或需要外部 IDE 或文档时,参与者往往无法识别错误或低估答案中的错误程度。由于其全面性和清晰的语言风格,ChatGPT 答案在39.34% 的情况下仍然受到青睐。
该论文指出,即使答案存在明显错误,12名参与者中仍有两人仍将首选答案标记为首选。论文将此归因于 ChatGPT 令人愉快、权威的风格。
此外,研究还发现 ChatGPT 的答案更容易犯概念错误,但在情绪表达上比 Stack Overflow 的答案更积极。
0000
评论列表
共(0)条相关推荐
苹果所创造的各种iPhone之最——看看哪代水果手机最经典
(一)乔布斯时代这是苹果的第二代iPhone,发布于2008年6月9日。这代搭载的iPhoneOS首次加入了AppStore(应用商店),在软件生态上遥遥领先于同时代对手。因为在那个时候,安卓手机还没有问世,微软的WM系统和诺基亚的塞班系统则根本没有应用商店——这两者的应用商店要等到后面的版本才有。站长网2023-05-24 04:03:410000马斯克入选“失败博物馆”:给孩子起名字也失败了
凤凰网科技讯北京时间5月2日消息,俗话说“失败是成功之母”。瑞典有个别出心裁的“失败博物馆”就是为了向人们展示大量精选的失败案例,帮助人们从过去的错误中吸取教训,这其中就包括大名鼎鼎的特斯拉CEO埃隆马斯克(ElonMusk)。0000时薪仅2美元心灵受重创,肯尼亚工人起诉要求调查OpenAI外包公司
本文概要:1.四名前ChatGPT劳工向肯尼亚政府请愿,要求调查OpenAI合作的内容审核公司Sama。2.前劳工声称在审核过程中遭受剥削和有害待遇,对心理健康造成持久影响。3.员工要求政府制定规定,保护从事有害和危险技术工作的人,并调查外包公司的滥用行为。站长网2023-08-07 10:53:510000英伟达收购人工智能初创公司 OmniML 押注边缘 AI
英伟达在今年2月悄悄收购了人工智能初创公司OmniML。OmniML的技术可以将机器学习模型小型化,使其能够在边缘设备上运行,而不依赖云端。一位发言人以及前OmniML员工的LinkedIn个人资料,他们现在都加入了英伟达。站长网2023-07-05 10:22:090001阿里巴巴张勇谈人工智能:有旧行业将消失 新的行业也会涌现
在近日的2023阿里巴巴罗汉堂数字经济年会上,在谈到人工智能带来的挑战时,阿里巴巴张勇表示,“人工智能的发展可以类比移动互联网。目前所有行业,包括制造业、交通业、金融业等,都会在AI的加持下不断升级。虽然有一些行业和岗位可能会受到影响,但随着技术的不断落地,旧的行业将会消失,新的行业也会涌现。”站长网2023-06-21 15:13:150000