OpenAI、谷歌、微软和 Adobe 等正与媒体机构谈判支付其训练生成式 AI 模型的内容费用
最近几个月,全球最大的科技公司正在与主要媒体机构进行谈判,就使用新闻内容来训练人工智能技术达成重要协议。

OpenAI、谷歌、微软和 Adobe 已经与媒体高管会面,讨论涉及其 AI 产品(如文本聊天机器人和图像生成器)的版权问题,根据几位熟悉谈判的人士透露。
据这些人透露,包括新闻集团、Axel Springer、纽约时报和卫报在内的出版商都与至少一家科技公司进行了讨论。
参与谈判的人士表示,这些协议可能涉及媒体机构以类似订阅费的方式收取内容费用,以开发 ChatGPT 等聊天机器人和谷歌的 Bard 等技术的基础。
媒体集团对 AI 带来的威胁以及 OpenAI 和谷歌在没有协议的情况下使用其内容的担忧日益加深。一些公司,如 Stability AI 和 OpenAI,面临着艺术家、摄影图库机构和程序员的法律诉讼,指控违反合同和版权。
在 5 月份的 INMA 媒体会议上,新闻集团首席执行官 Robert Thomson 总结了整个行业的愤慨,他说「我们的知识产权正受到威胁,我们应该为此争取赔偿」。
他补充说,人工智能「旨在使读者永远不会访问新闻网站,从而严重破坏了新闻业」。
达成协议将为新闻机构与全球生成型 AI 公司的合作关系制定蓝图。
《金融时报》表示:「版权对所有出版商来说都是一个关键问题。作为一个订阅业务,我们需要保护我们的新闻价值和商业模式。与相关公司进行建设性对话,正是实现这一目标的最佳方式。」
媒体行业高管希望避免重蹈互联网时代早期的覆辙,当时许多媒体免费在线提供文章,最终破坏了他们的商业模式。随后,谷歌和 Facebook 等大型科技公司利用这些信息来建立了价值数十亿美元的在线广告业务。
随着生成式人工智能的普及,新闻行业的担忧也在增加,因为这项技术能够生成逼真的大量人类文本。
谷歌最近宣布推出了一种生成式 AI 搜索功能,可以在传统的网页链接格式之上返回一个由人工智能编写的信息框。该功能已在美国推出,并准备在全球范围内发布。
目前的一些讨论涉及寻找新闻内容作为 AI 模型训练数据的定价模型。根据一位行业高管的说法,出版商之间讨论过的一个数字是每年 500 万至 2000 万美元。
Axel Springer 的首席执行官 Mathias Döpfner 表示,他首选的选择是创建一个类似音乐行业开发的「定量」模型,该模型让广播电台、夜店和流媒体服务每次播放一首歌曲时向唱片公司支付费用。但这首先需要 AI 公司披露他们使用媒体内容的情况,目前他们并未这样做。
Döpfner 还表示,年度协议可以提供对媒体公司内容的无限使用,但这种模式对于小型地区或本地新闻机构来说更难以利用。
他说:「我们需要一个全行业的解决方案。我们必须共同努力。」
谷歌一直在与英国新闻机构进行谈判,会见了卫报和 News UK。这家 Alphabet 子公司已与许多媒体组织建立了长期合作关系,以使用来自文章等内容数据来确保对其进行优化以显示在其搜索引擎中。据两位熟悉该安排的人透露,该公司已使用这些数据来训练其大型语言模型。
一位报纸集团的高管表示:「谷歌提出了一个授权协议。」他说:「他们已经接受了需要支付费用的原则……但我们还没有谈到具体数字。他们承认我们需要在未来几个月内进行价钱谈判,这是第一步。」
谷歌不会对财务讨论发表评论。然而,该公司表示正在与美国、英国和欧洲的新闻机构进行「持续对话」,已经使用「公开可用信息」来训练其人工智能,其中可能包括付费网站。
这家硅谷巨头还提到,他们正在考虑另一个选择,即如何让出版商对其内容是否成为 AI 训练数据集的一部分拥有更多的「选择和控制」权力,类似于它允许网站选择不使用其内容进行搜索的方式。
根据出版业负责人的说法,为使用新闻内容训练 AI 开发一个财务模型将非常困难。一些主要的美国出版商的高管表示,新闻行业在这方面是在事后追赶,因为科技公司在未经咨询他们的情况下推出了这些产品。
一位高管表示:「在这些产品推出之前,没有任何讨论,因此我们现在必须试图在事情发生之后得到报酬。他们推出这些产品的方式,完全保密,没有透明度,在事情发生之前没有沟通,有理由相当悲观。」
媒体分析师 Claire Enders 表示,目前的谈判「非常复杂」,并补充说,由于每个组织都采取自己的方法,媒体集团之间达成单一商业安排的可能性很小,并且可能会产生反效果。
参与会谈的人士表示,构建人工智能的科技公司热衷于关注其在提高新闻编辑室效率和加强新闻业方面的效用,并乐于支付数百万美元以维持与该行业的长期关系。
微软副主席 Brad Smith 表示,他们正在与媒体和出版商进行初步谈话,其中一部分是帮助每个人了解模型是如何训练的。
他补充说:「我认为我们更大的机会实际上是首先与出版商合作,思考如何利用人工智能来创造更多收入。」
Adobe 首席执行官 Shantanu Narayen 表示,最近几周他已经与迪士尼、天空电视台和英国《每日电讯报》会面,讨论如何为这些公司开发定制模型,以利用其生成型 AI 进行图像处理。
Adobe 的模型是在其自己的图像库和已经过公开许可和版权到期的公共领域内容的图片上进行训练的。Narayen 表示,定制协议和定价将取决于每家公司,但客户可以将他们自己的专有内容添加到该工具中。
Axel Springer 的 Döpfner 对达成协议表示乐观,因为媒体组织和政策制定者比上一波技术颠覆浪潮更快地意识到了挑战的规模。
他说,AI 公司「知道监管即将到来,他们对此感到恐惧。」他补充说:「对于所有各方来说,为了建立一个健康的生态系统,找到解决方案是符合各方利益的。如果没有创造知识产权的激励,就没有内容可供搜索。人工智能将变成人工愚蠢。」
618收官,小红书“买手+店播”两条腿走路
在各平台超头叙事逐渐失灵的这个618,小红书的商业化之路,依靠直播,水花渐起。6月19日,小红书电商公布“小红书618直播季”收官战报。战报显示,截至6月18日,直播订单数达去年同期5.4倍,直播间购买用户数达去年同期5.2倍,小红书电商业务正在持续加速跑。站长网2024-06-22 11:45:370000荣耀首款保时捷设计折叠屏预计明年 1 月发布 全球限量911台
近日,荣耀宣布与保时捷设计合作,共同打造下一代高端智能手机。据数码博主“厂长是关同学”透露,荣耀首款保时捷设计折叠屏预计在明年1月发布,产品内部代号为“荣耀911”,且全球限量发售911台。荣耀首款保时捷设计折叠屏的发布预计将引发新一轮抢购热潮。由于限量发售的属性,预计二手平台的价格会比产品本身高出数倍,成为2024开年首款“理财产品”。0000疯狂小杨哥下场,头部网红和MCN抢分短剧蛋糕
短剧已然成为了众人哄抢的“香饽饽”。近日,小杨哥公司“三只羊网络”入场拍短剧的消息引发热议。尤其是小杨哥之前宣布减少直播带货、淡出直播间,不免让人猜测,短剧或是他下一个发力的赛道。实际上,三只羊网络并非首个入局短剧的MCN机构,无忧传媒、麦芽传媒等机构早已入场,并找到了自己擅长的方式,做起了这笔时间短见效快的“划算生意”。站长网2024-04-24 14:40:100000为了盈利,B站都做了哪些事
这是《窄播Weekly》的第05期,本期我们关注的商业动态是:1.B站发布2023年Q4及全年财报,称实现全年正向经营现金流,并将于今年Q3盈利;2.抖音生活服务组织架构调整,生活服务与商业化部门多位负责人换岗,且提出年度6000亿的营收目标;3.窄播独家消息:TikTok电商将于5月在沙特开启本对本,SHEIN斋月订单量预计增长50%。以下为本期《窄播Weekly》的主要内容:0000智源开源中英文语义向量模型BGE 支持免费商用
近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAIGeneralEmbedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI的textembedding002等。此外,BGE保持了同等参数量级模型中的最小向量维度,使用成本更低。站长网2023-08-07 16:12:130000