为训练AI不择手段！Meta被曝下载数十TB盗版电子书

站长网2025-02-10 08:38:570阅

快科技2月9日消息，据媒体报道，一名图书作者对Meta提起诉讼，指控该公司未经授权下载了大量盗版电子书，用于训练其AI模型。

最新泄露的邮件显示，Meta承认下载了一个有争议的大型数据集LibGen，其中包括数千万本盗版书籍。

根据法庭文件，Meta通过名为安娜的档案”（Annas Archive）的渠道下载了至少81.7TB的数据，其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容，Meta还被指此前从LibGen下载了额外的80.6TB数据。

作者指出，Meta的这一行为构成了非法的电子书库种子下载，且这一数字可能只是其盗版行为的冰山一角。

作者估计，这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%，这表明Meta的盗版规模可能远超目前所揭露的。

邮件还显示，Meta公司员工也意识到其行为的法律风险，2023年4月，Meta的研究工程师尼古拉巴什利科夫在邮件中表示：用公司的笔记本电脑下BT感觉不妥。”

到2023年9月，巴什科夫加大了抗议力度，并咨询了法律团队，他指出，使用Torrents意味着对文件进行播种”，即对外共享内容，这在法律上是不允许的。

但Meta仍决定继续，并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。

为训练AI不择手段Meta被曝下载数十TB盗版电子书

0000

评论列表

共(0)条

相关推荐

站长资讯
百度：7月初起累计下架涉及未成年人相关有害信息7.4万条
百度发布关于开展“互联护苗2023网络专项举报工作”专项治理的公告称，从7月初起，平台开展了“互联护苗2023网络专项举报工作”。此次专项工作重点整治7方面网上涉未成年人突出问题，主要包括:有害内容隐形变异问题、网络欺凌问题、隔空猥亵问题、网络诈骗问题、不良内容问题、网络沉迷问题和新技术新应用风险问题。
站长网2023-09-05 08:50:38
0000
科幻作家Cory Doctorow批评AI是一个充满欺诈的泡沫但并非一无是处
**划重点:**1.📉作者CoryDoctorow认为AI行业存在典型科技泡沫，类比点com危机，预言AI可能会迎来崩溃。2.🤔尽管AI泡沫充满欺诈，但Doctorow认为在泡沫破裂后可能会留下一些有价值的东西，与加密货币和NFT行业不同。3.🔄尽管存在欺诈和运行成本巨大，Doctorow认为AI仍有潜力在特定领域发挥作用，但替代人类工作的可能性可能是不切实际的。
站长网站长资讯2023-12-20 10:01:32
0000
站长资讯
小米小爱大模型即将全量升级：全部免费！本月底手机、平板、电视全支持
快科技7月21日消息，小米已经宣布，小米小爱大模型将迎来全量升级，全部免费。据悉，小爱升级大模型之后会更聪明，比如支持智能问答功能，并能够根据用户要求创作等等，甚至闲聊的体验都能大幅升级。根据官方公布的时间表，7月底手机、平板、电视将升级支持。具体如下：手机：小米5及红米5以后机型，版本V6.126.5。平板：小米平板5及以后机型，版本V6.126.5。
站长网2024-07-22 07:44:43
0001
Hugging Face：2023开源LLM大爆发，数据竞赛已开启！
【新智元导读】2023年的LLM开源社区都发生了什么?来自HuggingFace的研究员带你回顾并重新认识开源LLM2023年的大语言模型（LLM），让几乎所有人都燃起了热情。现在大多数人都知道LLM是什么，以及可以做什么。人们讨论着它的优缺点，畅想着它的未来，向往着真正的AGI，又有点担忧自己的命运。围绕开源与闭源的公开辩论也吸引了广泛的受众。2023年的LLM开源社区都发生了什么
站长网站长资讯2024-01-01 11:05:20
0001
站长资讯
AI发展现状报告：AI项目同比增长34倍、OpenAI主导、开源项目崛起
站长之家（ChinaZ.com）导语:随着大语言模型（llm）的应用，机器学习(ML)和人工智能(AI)第一次成为日常开发人员触手可及的工具。原本那些连大型科技公司都开发不了的软件，突然之间成为普通开发者也能构建的产品，成为大家共享的乐趣。
站长网2023-07-19 14:15:55
0005