UC伯克利研究人员推出Ghostbuster:用于检测 LLM 生成文本的最先进 AI 方法
划重点:
🔍 加州大学伯克利分校的研究人员开发了一种名为 Ghostbuster 的新方法,用于检测 LLM 生成的文本。
🧠 Ghostbuster 使用结构化搜索和线性分类的三阶段训练过程,表现出强大的性能。
📈 Ghostbuster 在不同数据集上均表现出色,优于 DetectGPT 和 GPTZero。
LLM,如 ChatGPT,可以轻松地产生各种流利的文本,但是它们的准确性有多高呢?语言模型容易产生事实错误和幻觉,这让读者在决定是否相信一个信息来源时知道是否使用了这些工具来做新闻文章或其他信息文本的幽灵写作。这些模型的发展也引发了对文本的真实性和原创性的担忧,许多教育机构也限制了 ChatGPT 的使用,因为内容很容易生成。
目前存在许多用于检测 LLM 是否生成内容的框架,如 DetectGPT 和 GPTZero。然而,这些框架在原本未经评估的数据集上的性能有所下降。
近日,加利福尼亚大学伯克利分校的研究人员推出了一种名为Ghostbuster的先进人工智能方法,旨在检测大型语言模型(LLM)生成的文本。这一方法基于结构化搜索和线性分类,通过三个阶段的训练过程,名为概率计算、特征选择和分类器训练,取得了显著的性能提升。
Ghostbuster首先将每个文档转换为一系列向量,通过在一系列语言模型下计算每个令牌的概率来实现。接下来,它通过在向量和标量函数空间上运行结构化搜索过程,选择特征。这些特征通过定义一组操作,将这些概率结合起来,并运行前向特征选择。最后,Ghostbuster在最佳的基于概率的特征和一些额外手动选择的特征上训练一个简单的分类器。
Ghostbuster的分类器是根据通过结构化搜索选择的基于概率的特征和基于词长和最大令牌概率的七个额外特征的组合进行训练的。这些其他特征旨在包含观察到的关于人工智能生成文本的定性启发。
在性能方面,Ghostbuster在训练和测试数据集相似性方面表现稳健。在所有条件下,Ghostbuster的F1分数平均达到97.0,比DetectGPT高出39.6,比GPTZero高出7.5。
Ghostbuster 在除创意写作领域以外的所有领域中优于 RoBERTa 基线,而 RoBERTa 的越域表现要差得多。F1分数是一种常用的衡量分类模型性能的指标。它将精确度和召回率结合成一个单一的值,特别适用于处理不平衡的数据集。
Ghostbuster的出现填补了在非原始评估数据集上性能不佳的检测框架的空白,为更可靠地判断LLM生成文本的真实性提供了新的工具。这对于那些依赖于AI生成内容做出决策的用户来说,具有重要的意义。
论文网址:https://arxiv.org/abs/2305.15047
官网博客:https://bair.berkeley.edu/blog/2023/11/14/ghostbuster/
低配版英伟达GPU国内炒至10万元!算力军备竞赛重启
作者丨张睿编辑丨康晓出品丨深网·腾讯新闻小满工作室“算力不能保证我们在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的。”百度创始人李彦宏日前在一次内部分享中表示。但无可否认,算力是大模型发展的关键基础,全球各大科技公司对算力储备资源的争夺正愈演愈烈。站长网2023-05-24 17:41:310000当“洪水猛兽”走进课堂:在高中,我用游戏教历史
近期,B站出现了一道颇为离谱的风景线。明明长期“势同水火”的教育与电子游戏,却同时出现在了各大校园的课堂上。比如上海大学某高数课上,老师用《原神》给大家讲起了数学。又比如另一位物理老师,守了5年,终于等到了用《塞尔达传说:旷野之息》讲解“小船过河”的机会。站长网2023-04-13 11:00:060002亚马逊推出全新 Kindle Colorsoft:期待已久的彩色电子阅读器
在经历了多年的用户呼声后,亚马逊终于在纽约的发布会上推出了全新的KindleColorsoftSignatureEdition,满足了用户对彩色电子阅读器的期待。这款新设备不仅将彩色阅读体验带给用户,还在设计和技术上进行了全方位的创新。Colorsoft售价279.99美元,今天开始接受预订,并将于10月30日正式发货。站长网2024-10-18 22:00:420000AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?
2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google旗下DeepMind开发的AlphaGo战胜围棋选手李世石,直接推高市场对AI的想象,一批AI公司崛起,有人把这一年称作“AI元年”。站长网2023-05-23 11:36:480001不止“李跳跳”!“叮小跳”等多个同类App收到律师函
快科技8月24日消息,今天早些时候,用于安卓手机跳过各大App开屏广告的李跳跳”官方宣布,由于收到一份律师函,将无限期停止更新。经过快科技统计,除了李跳跳外,还有多款同类软件在近日宣布停止更新,原因同样是收到律师函。其中,叮小跳运营主体公众号羊小蜜在公告中表示,将关闭官方网站及所有下载渠道,服务器也将在到期后自动销毁。站长网2023-08-24 23:31:500000