互联网时代下 AI 与人类创造力的角逐:当 AI 向 AI 生成数据学习时「模型崩溃」将引发混乱
在大型语言模型(LLM)越来越多地依赖于 ChatGPT 和其他工具来提高效率的情况下,我们可以预见到未来很大一部分网络内容将由人工智能生成。然而,这可能对大型语言模型的未来构成严重风险,因为目前它们依赖于从网络上抓取的人类生成数据。

剑桥大学、牛津大学、多伦多大学和伦敦帝国理工学院的一组研究人员发表了一篇研究论文,对 LLMs 最终使用人工智能生成数据作为训练数据提出了警告。这篇名为《递归的诅咒:在生成数据上训练会让模型遗忘》的论文描述了一种退化过程,称为「模型崩溃」,在这种过程中,模型与现实脱节,并被自己的输出内容所破坏。
随着人工智能工具的广泛使用,这种情况很可能会发生。广泛使用人工智能将导致人工智能生成的内容被作为大型语言模型的训练数据,从而导致其输出的不准确和失真。
这个问题在大型语言模型、变分自编码器和高斯混合模型中都有观察到,随着时间的推移,它们开始「遗忘真实的基础数据分布」,因为它们所训练的数据变得污染程度很高,不再与真实世界的数据相似。
鉴于模型崩溃的严重风险,研究人员强调了获得原始分布数据的重要性,这些数据通常由人类生成。毕竟,人工智能语言模型旨在与人类进行交互,因此需要与现实保持联系,以正确模拟我们的世界。
为解决这个问题,研究人员提出了几种更智能的大型语言模型训练方法。其中一种方法是「先发优势」,强调保留对原始人工生成数据源的访问权限。
然而,由于很难区分 AI 生成的数据和人类生成的数据,该研究论文明确提出,「社区范围的协调」对于确定数据来源至关重要,以确保涉及 LLM 创建和部署的各方共享所需的信息。
论文补充说,但在人们越来越广泛地使用生成式人工智能和对技术占据岗位的担忧之间,对于人类创作者来说也存在一线希望。
研究论文推测,随着互联网上生成式人工智能数据的增加,人类创造的内容将变得越来越有价值,即使只是作为训练大型语言模型时的无污染数据来源。
首场直播就赚了130万引热议 李斌本人回应:实际收入3.3万元
快科技3月22日消息,近期,蔚来李斌首次直播收入130万元的消息,引起网友热议。对此,李斌日前在其个人社交平台发布视频回应称,由于自己是第一次直播,对业务并不熟悉,所以开通了打赏功能。随后,李斌晒出直播收入明细,并笑称自己也想多点收入,但当晚的实际收入为33088元,并没有网传的那么夸张。李斌决定将这个钱全部捐给大学生方程式这个赛事,后续将继续接受打赏,所获收入也全部捐出。站长网2024-03-23 17:12:020000研究称 AI、ChatGPT 和社交媒体可能加剧气候危机
划重点:⭐AI和社交媒体可能阻碍气候变化应对努力⭐AI和社交媒体影响人类行为和社会动态⭐使用AI产品和社交媒体需谨慎,注意信息真实性和影响气候行动的潜在影响一项发表在《全球环境政治》期刊上的论坛文章指出,生成式人工智能(AI)包括像OpenAI的ChatGPT这样的大型语言模型,以及社交体可能会削弱应对气候变化的努力。站长网2024-05-11 06:50:550000马斯克起诉奥特曼 称OpenAI违背造福人类初衷
旧金山高等法院近日受理了一起引人注目的诉讼案件。特斯拉CEO埃隆·马斯克通过洛杉矶的律师事务所Irell&Manella,以违反合同为由对OpenAI及其CEO萨姆·奥特曼提起了诉讼。站长网2024-03-01 17:40:290000FF将于5月31日举行终极发布活动 介绍FF91交付计划
FaradayFuture(FF)宣布,FF91&FaradayFuture2.0终极发布将于北京时间5月31日举行。5月31日发布活动中,将回顾FF走过的历程,分享FF91车型的最新进展,展示全新的用户体验,公布升级后的产品和技术架构、AI战略、生态产品、服务与销售和共创共享平台等,并介绍FF91的交付计划。站长网2023-05-23 10:35:150000雷军组团赴蔚来围观乐道L60 李斌称小米SU7把Model3比下去了
今日,小米科技创始人雷军亲自率领小米团队造访蔚来汽车总部,蔚来董事长李斌亲自接待,双方就未来合作与发展进行了深入交流。在一段由李斌发布的视频中,李斌巧妙地邀请雷军为蔚来旗下乐道品牌打广告,展现了高情商的沟通技巧。站长网2024-05-21 01:20:570000