研究发现 52% 的 ChatGPT 编程问题回答错误
划重点:
- 研究人员发现,ChatGPT 生成的编程问题答案中有52% 是错误的。
- ChatGPT 的答案在语言上更正式和分析性更强,但存在信息不准确、冗长和与人类答案不一致的问题。
- 尽管存在严重缺陷,但许多人类程序员更偏好 ChatGPT 的答案。
在过去的几年里,计算机程序员纷纷转向诸如 OpenAI 的 ChatGPT 之类的聊天机器人来帮助他们编码,这对 Stack Overflow 等网站造成了打击,导致其去年不得不裁员近30% 的员工。然而,问题在于,普度大学的研究团队在计算机 - 人类交互会议上发布了研究成果,发现 ChatGPT 生成的编程问题答案中有52% 是错误的。

图源备注:图片由AI生成,图片授权服务商Midjourney
对于一个人们依赖于准确性和精确性的程序来说,这一比例是惊人的,这也突显出其他最终用户如作家和教师所经历的问题:像 ChatGPT 这样的 AI 平台经常在空中凭空产生完全错误的答案。研究人员在研究中回顾了517个 Stack Overflow 的问题,并分析了 ChatGPT 尝试回答这些问题的结果。他们写道:“我们发现52% 的 ChatGPT 答案包含错误信息,77% 的答案比人类答案更冗长,78% 的答案与人类答案存在不同程度的不一致”。
该团队还对随机选择的2000个 ChatGPT 答案进行了语言分析,发现这些答案 “更正式和分析性更强”,同时表现出 “更少的负面情绪” —— 这是 AI 倾向于产生的单调而愉快的语气。尤其令人担忧的是,许多人类程序员似乎更喜欢 ChatGPT 的答案。普度大学的研究人员对12名程序员进行了调查,并发现他们以35% 的比例更倾向于选择 ChatGPT,并且在39% 的情况下没有发现 AI 生成的错误。
为什么会发生这种情况呢?这可能只是因为 ChatGPT 比在线人更有礼貌。研究人员写道:“后续的半结构化访谈揭示出,礼貌的语言、文雅而教科书般的回答方式以及全面性是 ChatGPT 答案看起来更具说服力的主要原因之一,因此参与者放低了警惕,忽略了 ChatGPT 答案中的一些错误信息”。
这项研究表明,ChatGPT 仍然存在重大缺陷,但这对于被 Stack Overflow 裁员的人或者不得不纠正 AI 生成的代码错误的程序员来说是一个苦涩的安慰。
百万在线,大圣归来!《黑神话:悟空》石破天惊,RTX 4090D飞越花果山
【新智元导读】等待四年,《黑神话:悟空》终于上线。激动的心,颤抖的手,全球玩家们都在电脑屏幕前集结,见证这一中国游戏史上里程碑的一刻。打破多项纪录后,中国游戏版图,会被它撼动吗?就在刚刚,《黑神话:悟空》一上线,就创造了中国游戏史上的奇迹!睽违四年,这一刻,苦苦等待们的玩家们沸腾了。《黑神话:悟空》,将是第一款跻身世界一流水平的国产单机游戏,也注定会是中国游戏史上的一座里程碑。站长网2024-08-20 14:04:040000搜狐CEO张朝阳称华为技术绝对值得信任
近日,搜狐出品的一档节目《BOSS11》第34期中,搜狐创始人兼首席执行官张朝阳对华为技术给予了高度评价。在节目中,对于华为的技术实力,张朝阳表示:“好玩不贵、轻松有效,而且华为技术绝对值得信任。”他认为,采用华为数智化产品的企业已经走在了行业前列,通过更低的成本实现了更高的办公效率。据悉,此前搜狐与华为达成鸿蒙全面合作,宣布旗下搜狐新闻APP及搜狐视频APP都已经在鸿蒙化。0000华为申请运输工具类“非凡大师”商标!全新logo曝光 网友炸锅
快科技10月12日消息,据天眼查,近日,华为技术有限公司申请注册ULTIMATEDESIGN”商标,国际分类涉及运输工具,当前商标状态均为等待实质审查,一同曝光的还有新的Logo。值得一提的是,华为此前已成功注册两枚非凡大师”商标,国际分类涉及珠宝钟表、科学仪器。据悉,运输工具”包括电动运载工具、混合动力汽车、电动汽车、汽车、自行车、自平衡车、电动踏板车、摄影无人机等多种商品/服务。站长网2023-10-12 19:55:040000赛力斯2022年营收翻倍:问界M5/M7立大功
快科技4月29日消息,赛力斯日前公布2022年报,营业收入为341.05亿元,同比增长104.00%。赛力斯指出,营收变动原因主要系新能源汽车问界M5、M7单台售价较高,销量增加所致。据了解,赛力斯2022年全年销售整车26.72万辆,同比增长0.24%,其中新能源汽车累计销量13.51万辆,同比增长225.90%,增速超行业平均水平。站长网2023-05-12 20:38:190000ChatGPT预测狗狗币在2024年价格将达到1美元
文章概要:-ChatGPT称投资Dogecoin具有战略意义-ChatGPT预计Dogecoin将在2024年第一季度达到1美元-Dogecoin与马斯克关系依然牢固近日,ambcrypto作者SuzukiShillsalot使用ChatGPT对Dogecoin(狗狗币)未来价格走势的预测。站长网2023-10-09 11:41:330000