登陆注册
19128

Reddit通过与AI公司合作的数据授权收入达2. 03 亿美元

站长网2024-02-23 10:36:060

**划重点:**

1. 💰 Reddit在IPO招股书中透露,通过与AI公司签订数据授权协议,已实现合计2.03亿美元的收入。

2. 🤖 Reddit强调与AI供应商的关系,尤其是与OpenAI等公司的合作对其上市前景产生积极影响。

3. 🌐 Reddit数据对AI模型培训的重要性,以及AI公司如何通过授权协议获取这些数据,成为文章关注焦点。

Reddit公司在其拟议的首次公开募股(IPO)招股书中透露,通过与多家人工智能(AI)公司签订的数据授权协议,已实现合计2.03亿美元的收入。这些合同的期限为两到三年,其中预计在2024年底前将实现最低6,640万美元的收入。

在招股书中,Reddit特别强调了与AI模型培训公司的关系,这些公司使用Reddit上超过10亿篇帖子和超过160亿条评论的数据进行模型培训。尽管招股书未具体透露与哪些AI供应商签署了数据授权协议,但早些时候的报道提到一家“大型未透露的AI公司”可能是Google,其年度许可协议价值约为6000万美元。

图源备注:图片由AI生成,图片授权服务商Midjourney

OpenAI也被提及作为潜在的合作伙伴。OpenAI的首席执行官Sam Altman持有Reddit8.7%的股份,是第三大股东,曾担任过Reddit董事会成员。

Reddit数据之所以具有价值,是因为AI模型通过“学习”这些数据中的例子,可以生成文章、代码、电子邮件等。OpenAI等供应商从互联网上搜集数以亿计的这些例子用于模型训练。Reddit的数据包含大量的对话性数据和知识,对于训练和改进大型语言模型起到了关键作用。

在过去,Reddit并未对其数据进行人工智能培训目的的访问限制。然而,去年,Reddit改变了策略,认为其数据不应该免费提供给全球最大的公司。公司首席执行官Steve Huffman表示,他们的数据API能够提供对时事、电影、新闻、时尚等不断更新和动态主题的实时访问。

最近,随着聊天机器人(如OpenAI的ChatGPT和Google的Gemini)威胁到流量,从股票媒体库到新闻出版商等内容制作者越来越倾向于与AI供应商签订数据授权协议。这也是供应商主动追求许可协议的原因之一,因为他们面临着诉讼潮,指控他们在没有许可或支付的情况下对数据进行模型培训。最近,《纽约时报》指责OpenAI通过其作品有效地建立了新闻发布商的竞争对手,损害了其业务。

OpenAI已与图库Shutterstock以及出版商Axel Springer(Politico和Business Insider的所有者)达成协议,尽管这些许可协议金额相对较小,最高每年不超过500万美元。

Reddit通过数据授权实现的巨额收入凸显了数据在人工智能领域的关键作用,以及AI公司为获取高质量数据所付出的努力。这也进一步推动了AI公司与数据持有者之间的合作关系,为双方带来了可观的经济利益。

0000
评论列表
共(0)条