登陆注册

LLaMA都在用的开源数据集惨遭下架

  • LLaMA都在用的开源数据集惨遭下架:包含近20万本书,对标OpenAI数据集

    开源数据集因侵权问题,惨遭下架。如LLaMA、GPT-J等,都用它训练过。如今,托管了它3年的网站,一夜之间删除了所有相关内容。这就是Books3,一个由将近20万本图书组成的数据集,大小将近37GB。丹麦一家反盗版组织表示,在该数据集中发现了150本其成员的书籍,构成侵权,所以要求平台下架。现在该平台上的Books3网页链接已经“404”。
    站长网2023-08-21 21:53:48
    0000