首页站长资讯GPT-4成学术造假“神器”，伪造数据又快又合理，Nature请统计学专家“断案”

GPT-4成学术造假“神器”，伪造数据又快又合理，Nature请统计学专家“断案”

站长网2023-11-23 14:08:320阅

学术造假有了GPT-4，变得更容易了。

这两天，一篇刊登在Nature上的新闻表示，GPT-4生成的造假数据集，第一眼还真不一定看得出来。

除非请来业内专家仔细对数据集进行评估，才能发现个中细节的不合理性。

这个新闻的来源是一篇发表在JAMA Ophthalmology上的论文。

论文使用GPT-4为一项医学学术研究生成了一个假数据集，发现它不仅能创造出看似合理的数据，甚至还能用来准确支撑错误的论文观点。

对此，有网友表示十分理解:

大模型最重要的能力就是生成“看似合理的文本”，因此它非常适合干这活儿。

还有网友感慨:技术“有良心”的程度，也就和用它的研究人员一样了。

所以，GPT-4创造的假数据究竟长啥样?

GPT-4学术造假有一手

先来看看GPT-4是怎么生成假数据的。

具体来说，研究人员采用了GPT-4的高级数据分析（ADA，原代码解释器）功能，来生成一个假数据集。

这个过程中，研究人员给GPT-4提供了一些专业知识和统计学要求，让它生成的数据看起来更加“合理”。

第一步，给GPT-4输入一系列数据要求。

研究人员先给GPT-4提供了一系列详细的提示词，要求它创建一个关于圆锥角膜（keratoconus）眼部疾病患者的数据集。

圆锥角膜是一种疾病，会导致角膜变薄，导致注意力受损和视力不佳。

目前治疗圆锥角膜疾病的方式主要有两种，一种是穿透性角膜移植（PK），另一种是深板层移植(DALK)。

在没有任何实质性证据的情况下，研究人员让GPT-4捏造一组数据，支撑DALK比PK效果更好的观点。

随后，再设定了一系列统计标准，如要求GPT-4生成的术前和术后数据产生统计学上的显著差异。

第二步，就是生成数据了。

这个过程中可能会由于GPT-4字数限制，导致答案生成暂停，通过“继续”提示就能恢复生成过程。

最终，GPT-4成功生成了包含160名男性和140名女性患者的数据集，并做出了一组支撑DALK比PK效果更好的数据。

由GPT-4生成的假数据集长这样，表格1是关于分类变量的数据，包括患者性别、手术类型、免疫排斥等情况:

表2是关于连续变量，包括术前术后的视力矫正情况等:

论文作者之一Giuseppe Giannaccare博士表示，如果非常快速地查看这个数据集，很难识别出它其实“不是人做的”。

专家审查才能发现

为了验证GPT-4做出来的数据是否真的令人信服，Nature特意请来了英国曼彻斯特大学生物统计学家杰克·威尔金森（Jack Wilkinson）和同事Zewen Lu，来检查数据可信度。

检查结果表明，许多捏造出的患者在性别、名字匹配度上就有问题（例如Mary的性别一栏是男性一样）。

然后，一些数据之间的相关性也不高，包括术前和术后视力测量与眼部成像检查（eye-imaging test）之间的数据相关性等。

最后，患者的年龄也设置得不同寻常。

在检查之后，用GPT-4生成假数据集的研究人员也承认，大模型在生成数据集上还存在有缺陷的地方。

但杰克·威尔金森（Jack Wilkinson）依旧对结果表示了担忧:

一旦知道自己“哪里露馅了”，AI很容易就能纠正它，并生成更加具有说服力的结果。

有网友认为，这篇文章最大的意义并不在于证明“GPT-4有幻觉”;

更重要的是，它证明了GPT-4生成看似合理的数据集“非常容易”，也算是一种对期刊的警告（记得严格审稿!）。

不过，也有网友感觉研究意义不大，因为即使没有ChatGPT这样的工具，真想造假的学者也能很容易伪造出一套数据。

One More Thing

此外，这两天一段关于ChatGPT的视频在抖音上也是火得不行。

视频中，终于毕业的歪果仁小哥直呼“感谢ChatGPT帮助我完成所有作业和考试”（手动狗头）

那么，对于ChatGPT在学术研究上可能带来的问题，你怎么看?

参考链接:

[1]https://jamanetwork.com/journals/jamaophthalmology/article-abstract/2811505

[2]https://www.nature.com/articles/d41586-023-03635-w

[3]https://news.ycombinator.com/item?id=38386547

—完—

GPT4成学术造假神器 伪造数据又快又合理Nature请统计学专家断案

0000

评论列表

共(0)条

相关推荐

站长资讯
爱奇艺CEO龚宇谈AI 称影视行业最后才会被AI取代
在今日的爱奇艺世界大会上，爱奇艺创始人兼CEO龚宇指出，爱奇艺在过去几年经历了一个痛苦阶段，但是影视行业最艰难的时期已经过去了。爱奇艺会坚持长期主义，以作品为唯一价值点，专注于做自己擅长的事，并避免做情怀和野心的事情。公司将奋力追求高质量增长，实现营收利润双增长，持续提升作品数量和质量，而不是一味追求单纯的增长。龚宇认为，对于爱奇艺来说，跑马圈地的增长已经不再适用。
站长网2023-05-10 11:15:17
0000
站长资讯
X 正式推出音频和视频通话功能迈向 “一切应用程序” 的目标
据国外媒体报道，X（以前称为Twitter）平台正在推出音频和视频通话功能。一些用户在打开应用程序时收到了一条通知，内容是:“音频和视频通话就在这里!”此外，应用程序的设置中新增了一个“启用音频和视频通话”切换按钮，用户可以选择“打开该功能，然后选择您愿意与谁一起使用它。”该功能包括仅允许来自地址簿中的人、您关注的人、经过验证的用户或全部三者进行音频和视频呼叫的选项。
站长网2023-10-26 09:55:21
0001
美团闪购加码“每日神价”，打造即时零售“天天低价”专区
Tech星球获悉，近期，美团闪购对其频道内主打生活消耗品“天天低价”的“每日神价”专区，进行了更大范围的放量提级。
站长网站长资讯2025-05-19 09:58:10
0000
站长资讯
扎克伯格：AGI开发将成为公司未来五年最重要的战略之一
本周Meta宣布全力冲刺通用人工智能（AGI）外，公司内部还有一条重磅消息——扎克伯格将旗下顶尖AI研究团队FAIR纳入产品部门。这意味着，原先隶属于技术总监BozBosworth领导的RealityLabs，现将由首席产品官ChrisCox直接掌控FAIR和GenAI两大AI重器。
站长网2024-01-19 09:58:28
0000
站长资讯
苹果计划以缓慢且仅限预约的方式推出首款 Vision Pro
最近，苹果进入了全新的产品领域，推出了VisionPro混合现实头戴设备。在WWDC2023上，该公司宣布了这款售价为3499美元的新头显。关于这个高价格会阻碍销售的议论甚嚣尘上，而苹果似乎计划相应地销售这款产品。
站长网2023-07-10 16:49:23
0000