《纽约时报》禁止人工智能公司使用其内容进行模型算法训练
据 Adweek 报道,纽约时报在 8 月初更新了其服务条款,禁止将其文章和图片用于人工智能训练。此举发生在科技公司继续通过像 ChatGPT 和 Google Bard 这样的 AI 语言应用获取数据的大规模未经授权抓取的情况下。
新的条款禁止未经明确书面许可使用时报的内容,包括文章、视频、图片和元数据,用于训练任何 AI 模型。在服务条款的第 2.1 节中,纽约时报称其内容仅供读者的「个人非商业使用」,非商业使用不包括「开发任何软件程序,包括但不限于训练机器学习或人工智能(AI)系统」。
在接下来的第 4.1 节中,条款规定,未经纽约时报的事先书面同意,任何人都不得「将内容用于开发任何软件程序,包括但不限于训练机器学习或人工智能(AI)系统。」
纽约时报还概述了违反限制规定的后果:「进行禁止使用服务的行为可能导致对用户及协助用户的人员的民事、刑事和/或行政处罚、罚款或制裁。」
尽管听起来很威胁,但限制性使用条款以前并没有阻止将整个互联网转化为机器学习数据集。目前所有大型可用的语言模型,包括 OpenAI 的 GPT-4、Anthropic 的 Claude 2、Meta 的 Llama 2 和 Google 的 PaLM 2,都是在从互联网抓取的大量材料的基础上进行训练的。通过一种称为无监督学习的过程,将 web 数据输入神经网络,使 AI 模型通过分析单词之间的关系获得语言的概念意义。
使用抓取的数据来训练 AI 模型的争议性,在美国法庭上尚未完全解决,已经导致至少一起指控 OpenAI 涉嫌剽窃的诉讼。上周,美联社和其他几家新闻机构发表了一封公开信,称「必须制定法律框架来保护驱动 AI 应用的内容」,其中提出了其他关切。
OpenAI 可能预期未来会面临持续的法律挑战,并已开始采取一些举措,可能是为了应对这些批评,OpenAI 最近宣布,网站运营商现在可以阻止其 GPTBot 网络爬虫抓取其网站。这导致一些网站和作者公开表示将阻止这个爬虫。
微软还在自己的条款和条件中添加了一些新的限制,禁止人们使用其人工智能产品「创建、训练或改进(直接或间接)任何其他人工智能服务」,同时禁止用户从其人工智能工具中抓取或以其他方式提取数据。
目前已经抓取的内容已经成为 GPT-4 的一部分,包括纽约时报的内容。也许我们要等到 GPT-5 才能看到 OpenAI 或其他 AI 供应商是否尊重内容所有者希望被排除在外的愿望。如果没有的话,可能会出现新的 AI 诉讼或法规。
东方甄选入驻拼多多,出抖计划再进一步
东方甄选的抖音出逃计划,又有新动作了。最近,东方甄选悄悄入驻了拼多多。比起之前入驻淘宝时,大张旗鼓地联合宣传,这一次,东方甄选看上去格外低调,可以说是不动声色。如果说,之前出抖入淘,东方甄选还有种跟抖音明面叫嚣的意味在,现在它的种种动作,更像在以一种平常心稳步推进。站长网2024-03-15 09:17:390000三星计划 2025 年推出第六代高性能 HBM4 DRAM:争夺快速增长的 AI 芯片领域的主导地位
站长之家(ChinaZ.com)10月11日消息:三星电子周三发布的初步财报显示,第三季度营业利润同比下降77.9%,原因是全球芯片供应持续过剩的影响导致其芯片业务出现亏损。该公司将于本月晚些时候发布第三季度正式财报。站长网2023-10-11 16:55:290000“3 天删了 5 万行代码后,我的 Web 程序活得更好了!”
站在一名技术工程师的角度来看,「一款完美的应用程序,并不是指所有功能一应俱全,已经没有什么新功能能够添加进来,而是指所有功能版块都非常重要且活跃度很高,已经没有什么可以删除了」。0000自定义ChatGPT商店下周上线!大模型“App Store时刻”来啦
1月5日凌晨,OpenAI向所有自定义GPT开发者发布了一封邮件,下周将上线“自定义GPT商店”。自定义GPTs是OpenAI在去年首届开发者大会上发布的重磅产品,用户无需任何代码,全程支持可视化点击操作。用户只需要提交对话指令、额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能,就能快速开发法律、金融、医疗等特定领域的ChatGPT助手。0002OpenAI 的动荡震撼了硅谷,让一些技术人员对人工智能的未来感到担忧
近年来,硅谷的大部分领域已将希望和财富押注在生成型人工智能技术上,OpenAI在推广这类技术方面起到了关键作用。许多行业专家将去年晚些时候ChatGPT的推出比作iPhone的突破性时刻,它可能引领人们通过书面提示与计算机互动的方式发生转变,产生创造性且近似于人类的文本。站长网2023-11-20 11:58:320000