Reddit通过与AI公司合作的数据授权收入达2. 03 亿美元
**划重点:**
1. 💰 Reddit在IPO招股书中透露,通过与AI公司签订数据授权协议,已实现合计2.03亿美元的收入。
2. 🤖 Reddit强调与AI供应商的关系,尤其是与OpenAI等公司的合作对其上市前景产生积极影响。
3. 🌐 Reddit数据对AI模型培训的重要性,以及AI公司如何通过授权协议获取这些数据,成为文章关注焦点。
Reddit公司在其拟议的首次公开募股(IPO)招股书中透露,通过与多家人工智能(AI)公司签订的数据授权协议,已实现合计2.03亿美元的收入。这些合同的期限为两到三年,其中预计在2024年底前将实现最低6,640万美元的收入。
在招股书中,Reddit特别强调了与AI模型培训公司的关系,这些公司使用Reddit上超过10亿篇帖子和超过160亿条评论的数据进行模型培训。尽管招股书未具体透露与哪些AI供应商签署了数据授权协议,但早些时候的报道提到一家“大型未透露的AI公司”可能是Google,其年度许可协议价值约为6000万美元。
图源备注:图片由AI生成,图片授权服务商Midjourney
OpenAI也被提及作为潜在的合作伙伴。OpenAI的首席执行官Sam Altman持有Reddit8.7%的股份,是第三大股东,曾担任过Reddit董事会成员。
Reddit数据之所以具有价值,是因为AI模型通过“学习”这些数据中的例子,可以生成文章、代码、电子邮件等。OpenAI等供应商从互联网上搜集数以亿计的这些例子用于模型训练。Reddit的数据包含大量的对话性数据和知识,对于训练和改进大型语言模型起到了关键作用。
在过去,Reddit并未对其数据进行人工智能培训目的的访问限制。然而,去年,Reddit改变了策略,认为其数据不应该免费提供给全球最大的公司。公司首席执行官Steve Huffman表示,他们的数据API能够提供对时事、电影、新闻、时尚等不断更新和动态主题的实时访问。
最近,随着聊天机器人(如OpenAI的ChatGPT和Google的Gemini)威胁到流量,从股票媒体库到新闻出版商等内容制作者越来越倾向于与AI供应商签订数据授权协议。这也是供应商主动追求许可协议的原因之一,因为他们面临着诉讼潮,指控他们在没有许可或支付的情况下对数据进行模型培训。最近,《纽约时报》指责OpenAI通过其作品有效地建立了新闻发布商的竞争对手,损害了其业务。
OpenAI已与图库Shutterstock以及出版商Axel Springer(Politico和Business Insider的所有者)达成协议,尽管这些许可协议金额相对较小,最高每年不超过500万美元。
Reddit通过数据授权实现的巨额收入凸显了数据在人工智能领域的关键作用,以及AI公司为获取高质量数据所付出的努力。这也进一步推动了AI公司与数据持有者之间的合作关系,为双方带来了可观的经济利益。
小杨哥徒弟小黄回应近期改变:从给兄弟带来欢笑到全面思考
1月10日晚,小杨哥的徒弟“红绿灯的黄”在直播中分享了她的近期感悟。她表示,过去自己只想着给观众带来欢乐,而忽视了这种行为可能对年轻观众造成的影响。现在,她开始意识到自己的责任,并努力提升直播内容的品质。“红绿灯的黄”坦言,以前自己的思考方式较为狭隘,认为某些行为并无大碍。但现在,她开始全面地看待问题,努力优化自己的缺点,希望为观众提供更有价值的内容。0000马斯克称有必要开展AI业务抗衡微软谷歌
马斯克在伦敦参加《华尔街日报》CEO理事会峰会时表示,他认为开展AI业务与谷歌和微软竞争是必要的。他还暗示,推特可能会成为他创建AI业务的一部分。马斯克表示,特斯拉一直在使用AI技术来改善其先进的辅助驾驶功能。马斯克提出,推特和特斯拉可以携手成为一家AI公司的合作伙伴,类似于微软和OpenAI的关系。据悉,马斯克已经创建了一家名为X.AI的AI公司。站长网2023-05-24 14:01:400000加拿大发布关于生成式AI系统的自愿行为准则
划重点:1.📜加拿大发布自愿行为准则:加拿大政府发布了有关生成式人工智能系统的自愿行为准则,旨在规范该技术的发展与使用。2.🧐准则内容概述:准则要求开发者和管理者在系统开发中承担责任、确保安全性、公平与公正,提高透明度、进行人工监督和监控,并确保系统有效性与健壮性。站长网2023-10-13 14:40:040000“百模大战”家家第一,大模型“跑分”作弊何时休?
今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”,据不完全统计,今年1-7月国内共发布了64个大模型,截至目前叫得出名字的国产大模型已接近200家。这么多大模型,哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况,甚至已不止一款国产大模型“碾压”了GPT-4,且很多“世界顶级”大模型是出自刚成立的团队之手。站长网2023-11-29 11:15:040000学术党狂喜,Meta推出OCR神器,PDF、数学公式都能转
我们平时在阅读论文或者科学文献时,见到的文件格式基本上是PDF(PortableDocumentFormat)。据了解,PDF成为互联网上第二重要的数据格式,占总访问量的2.4%。然而,存储在PDF等文件中的信息很难转成其他格式,尤其对数学公式更是显得无能为力,因为转换过程中很大程度上会丢失信息。就像下图所展示的,带有数学公式的PDF,转换起来就比较麻烦。站长网2023-08-30 14:00:370004