为训练AI不择手段!Meta被曝下载数十TB盗版电子书
站长网2025-02-10 08:38:570阅
快科技2月9日消息,据媒体报道,一名图书作者对Meta提起诉讼,指控该公司未经授权下载了大量盗版电子书,用于训练其AI模型。
最新泄露的邮件显示,Meta承认下载了一个有争议的大型数据集LibGen,其中包括数千万本盗版书籍。

根据法庭文件,Meta通过名为安娜的档案”(Annas Archive)的渠道下载了至少81.7TB的数据,其中包括来自知名盗版网站Z-Library和LibGen的至少35.7TB的内容,Meta还被指此前从LibGen下载了额外的80.6TB数据。
作者指出,Meta的这一行为构成了非法的电子书库种子下载,且这一数字可能只是其盗版行为的冰山一角。
作者估计,这些盗版电子书库可能仅占Meta盗版版权作品总量的0.008%,这表明Meta的盗版规模可能远超目前所揭露的。
邮件还显示,Meta公司员工也意识到其行为的法律风险,2023年4月,Meta的研究工程师尼古拉巴什利科夫在邮件中表示:用公司的笔记本电脑下BT感觉不妥。”
到2023年9月,巴什科夫加大了抗议力度,并咨询了法律团队,他指出,使用Torrents意味着对文件进行播种”,即对外共享内容,这在法律上是不允许的。
但Meta仍决定继续,并试图通过将数据集下载到非Meta服务器来避免被追溯的风险。
0000
评论列表
共(0)条相关推荐
百度:7月初起累计下架涉及未成年人相关有害信息7.4万条
百度发布关于开展“互联护苗2023网络专项举报工作”专项治理的公告称,从7月初起,平台开展了“互联护苗2023网络专项举报工作”。此次专项工作重点整治7方面网上涉未成年人突出问题,主要包括:有害内容隐形变异问题、网络欺凌问题、隔空猥亵问题、网络诈骗问题、不良内容问题、网络沉迷问题和新技术新应用风险问题。站长网2023-09-05 08:50:380000科幻作家Cory Doctorow批评AI是一个充满欺诈的泡沫 但并非一无是处
**划重点:**1.📉作者CoryDoctorow认为AI行业存在典型科技泡沫,类比点com危机,预言AI可能会迎来崩溃。2.🤔尽管AI泡沫充满欺诈,但Doctorow认为在泡沫破裂后可能会留下一些有价值的东西,与加密货币和NFT行业不同。3.🔄尽管存在欺诈和运行成本巨大,Doctorow认为AI仍有潜力在特定领域发挥作用,但替代人类工作的可能性可能是不切实际的。0000小米小爱大模型即将全量升级:全部免费!本月底手机、平板、电视全支持
快科技7月21日消息,小米已经宣布,小米小爱大模型将迎来全量升级,全部免费。据悉,小爱升级大模型之后会更聪明,比如支持智能问答功能,并能够根据用户要求创作等等,甚至闲聊的体验都能大幅升级。根据官方公布的时间表,7月底手机、平板、电视将升级支持。具体如下:手机:小米5及红米5以后机型,版本V6.126.5。平板:小米平板5及以后机型,版本V6.126.5。站长网2024-07-22 07:44:430001Hugging Face:2023开源LLM大爆发,数据竞赛已开启!
【新智元导读】2023年的LLM开源社区都发生了什么?来自HuggingFace的研究员带你回顾并重新认识开源LLM2023年的大语言模型(LLM),让几乎所有人都燃起了热情。现在大多数人都知道LLM是什么,以及可以做什么。人们讨论着它的优缺点,畅想着它的未来,向往着真正的AGI,又有点担忧自己的命运。围绕开源与闭源的公开辩论也吸引了广泛的受众。2023年的LLM开源社区都发生了什么0001AI发展现状报告:AI项目同比增长34倍、OpenAI主导、开源项目崛起
站长之家(ChinaZ.com)导语:随着大语言模型(llm)的应用,机器学习(ML)和人工智能(AI)第一次成为日常开发人员触手可及的工具。原本那些连大型科技公司都开发不了的软件,突然之间成为普通开发者也能构建的产品,成为大家共享的乐趣。站长网2023-07-19 14:15:550005