作者指控 Meta 不顾自己律师的警告,将受版权保护的书籍用于人工智能训练
Meta 在一起夏季提起的版权侵权诉讼中的最新提交文件显示,尽管律师警告使用数千本盗版书籍训练其 AI 模型的法律风险,该公司仍然这样做了。
周一晚间提交的新文件整合了针对 Facebook 和 Instagram 所有者的两起诉讼,由喜剧演员 Sarah Silverman、普利策奖得主 Michael Chabon 以及其他著名作者提起。他们指控 Meta 未经许可使用他们的作品训练其人工智能语言模型 Llama。
上个月,加州法官驳回了 Silverman 诉讼的一部分,并表示将允许作者修改他们的指控。Meta 尚未对这些指控作出回应。
周一提交的新起诉包括 Meta 关联研究员在 Discord 服务器上讨论数据集采购的聊天记录,这可能是一个重要证据,表明 Meta 知道其使用这些书籍可能不受美国版权法保护。
在起诉中引用的聊天记录中,研究员 Tim Dettmers 描述了他与 Meta 法律部门就使用书籍文件作为训练数据是否「合法」进行的讨论。
Dettmers 在 2021 年写道,他提到 Meta 承认用来训练 Llama 第一版的一个数据集「The Pile」,「在 Facebook,有很多人有兴趣使用 (The Pile),包括我自己,但以其当前形式,我们因法律原因无法使用它。」
根据起诉,Dettmers 在前一个月写道,Meta 的律师告诉他「如果数据被用来训练模型或发布,则不能使用该数据」。
尽管 Dettmers 没有详细描述律师的担忧,但聊天中的其他人指出,「仍在享有版权的书籍」可能是最大的担忧来源。他们表示,对数据的训练应该「属于合理使用范畴」,这是一种保护版权作品某些未经许可使用的美国法律原则。Dettmers 表示,他目前无法立即对这些指控发表评论。
今年,科技公司面临了一系列来自内容创作者的诉讼,他们指控这些公司剽窃受版权保护的作品,以构建在全球引起轰动并引发投资热潮的生成型 AI 模型。
如果这些案件成功,可能会抑制生成型 AI 的热潮,因为它们可能会通过迫使 AI 公司补偿艺术家、作者和其他内容创作者使用其作品而提高构建数据密集型模型的成本。
同时,欧洲新的临时人工智能法规可能会迫使公司披露用于训练模型的数据,从而可能使它们面临更多法律风险。
Meta 在 2 月发布了其 Llama 大型语言模型的第一个版本,并公布了用于训练的数据集列表,包括「ThePile」的 Books3 部分。根据起诉,组建该数据集的人称其包含 196,640 本书。
该公司并未透露其最新版本模型 Llama 2 的训练数据,该模型已于今年夏天投入商业使用。
Llama 2 对月活跃用户少于 7 亿的公司免费使用。其发布在科技领域被视为生成型 AI 软件市场的潜在游戏规则改变者,威胁到像 OpenAI 和 Google 这样的主导者,后者对其模型的使用收费。
被污名化太久!腾讯张立军:游戏推动芯片、AI等技术发展
快科技7月8日消息,腾讯公司副总裁、华东总部总经理张立军,在世界人工智能大会游戏AI应用与游戏科技论坛上为游戏正名。张立军表示,在过去半个多世纪里,游戏与前沿科技一直处于一种紧密的共生关系之中。站长网2023-07-10 00:07:320000返乡打工人,改写县城生意经
一、二线城市的消费市场,正在和县城呈现奇妙的镜像状态。在大量新兴品牌激战一二线城市时,县城里的商业,正依靠本地化与低成本经营,在基建日趋完善的当下,迎来繁荣发展期。在中国县域人口统计中常年位居前三的安徽省临泉县,正是其中的佼佼者。站长网2023-04-21 08:58:540000高德地图路线规划升级:出国游也能查公交地铁
高德地图迎新升级,解锁全球出行便利出国游也能畅享公交指南高德地图宣布,其路线规划功能现已覆盖海外90余座城市,未来将陆续拓展更多城市。这意味着出国旅行者也能轻松查询公交、地铁和火车的出行信息,畅享便捷的交通指南。北斗导航赋能,无网也能指引前行高德地图15.0版本带来了北斗卫星无网导航功能。在网络信号缺失的情况下,北斗卫星将成为可靠的导航助手,指引用户找到回家的路或探索未知区域。站长网2024-09-29 08:41:590000iPhone 15发布会定档9月13日,苹果这次要将牙膏挤爆?
来了,苹果官宣Apple特别活动定档北京时间2023年9月13日凌晨一点。而此次特别活动的主角,已众所周知——就是iPhone15系列。而汇总目前网上曝光的各种信息,则不难发现,今年苹果将为iPhone15系列带来重大革新,而苹果又将以此迎来全球销量“大丰收”。一、可能是iPhone牙膏挤爆的一年首先看iPhone15Pro机型。站长网2023-08-30 09:19:000000Gemini 驱动的谷歌手机可能会让 Siri 成为 iPhone 的致命弱点
谷歌在周三宣布推出一种名为Gemini的新型大型语言模型,该模型具备「视觉」和「听觉」能力以及新的学习和推理能力。更值得注意的是,谷歌还开发了一个适用于Android操作系统的版本,运行在其Pixel8Pro手机上。通过将生成式AI带入智能手机领域,谷歌正直接挑战其竞争对手苹果的主营业务,而苹果似乎表现出在明年将iOS和Siri做出类似改变的迹象甚微。0000