AI版权官司:Meta、微软等遭集体诉讼 侵权用他人书籍训练AI
🔍 划重点:
1. 迈克·哈克比与其他作者起诉多家科技公司,指控它们未经允许使用他们的作品来构建人工智能工具。
2. 这一集体诉讼是最新的例子,作者声称科技公司未经掁允许使用他们的作品来训练生成式AI模型。
3. 该官司关注的是一个备受争议的数据集“Books3”,其中包含超过18万份作品,用于训练大型语言模型。
前阿肯色州州长迈克·哈克比与其他一些作者正在对Meta、微软以及其他公司提起诉讼,指控它们未经授权使用他们的作品来开发人工智能工具。在本周提交的一项诉讼中,哈克比以及包括基督教作家莉莎·泰克赫斯特在内的其他作者声称,他们的书籍被盗版并用于训练AI模型的数据集。人工智能研究团队EleutherAI以及彭博公司也被列为被告。
这一提出的集体诉讼是作者指控科技公司未经授权使用其作品来训练生成式人工智能模型的最新例子。在过去几个月中,一系列知名作者,包括乔治·R·R·马丁、乔迪·皮库特以及迈克尔·查邦,都曾因OpenAI侵犯版权问题而起诉。
迈克·哈克比的案件集中在一个备受争议的数据集“Books3”上,其中包含超过18万份作品,用于训练大型语言模型。今年八月,The Atlantic杂志发布了“Books3”中所有标题以及作者信息的可搜索数据库。而“Books3”实际上是EleutherAI创建的更大数据集“Pile”的一部分,该诉讼称这些数据集被公司用来训练他们的产品。
诉讼文件中提到:“[Meta和微软]能够在LLM的训练过程中整合包括‘Books3’中的盗版受版权保护的材料在内的复杂数据集,而无需赔偿作者。” Microsoft拒绝对此事置评,而Meta、彭博和EleutherAI则未回应置评请求。
人工智能公司依赖大量公共数据来训练AI模型,不仅限于书籍,还包括照片、艺术、音乐等。随着诸如ChatGPT或Stable Diffusion等工具变得容易获得,关于提供数据的人应该如何得到补偿的争论日益加剧,也涉及大量法律诉讼。今年一月,Getty Images起诉AI艺术工具Stable Diffusion的公司,声称其非法复制数百万张受版权保护的图像来训练模型。
荣耀Magic V2发布 赵明称折叠手机进入毫米级时代
荣耀公司在昨日举行的新品发布会上,正式推出了荣耀MagicV2。这款手机采用了第二代骁龙8领先版,并通过新材料和新技术的应用,将机身厚度和重量进一步降低,展现了荣耀公司在技术创新和产品设计上的不懈追求。站长网2023-07-13 21:47:410000做不了YouTube的B站,试着变成抖音
近日,韩国放送公社KBS起诉B站侵权,相关案件将于10月11日和11月8日在上海市杨浦区人民法院开庭审理。事实上,无论是“搬运”还是“二创”,都近些年使得B站频频陷入侵权纠纷。向B站追责的对象,既有爱奇艺、网易等一众互联网平台,也有以中超联赛、中职篮为代表的职业体育联赛等,还有尚雯婕、葛优等艺人。站长网2023-08-30 18:15:420000抖音推出作品修改功能 作者可修改违规或待优化内容
抖音推出了一项新的作品修改功能,目前该功能仅对粉丝量超过10万的创作者和部分受邀创作者开放测试,并计划未来向更多用户开放。当创作者的作品被提示存在违规或待优化内容时,他们可以通过通知消息进入修改编辑页进行修改。修改编辑页面提供了剪切内容、添加文字说明和使用贴纸遮挡等功能。作品在发布24小时内允许修改一次,修改后的作品会标记为已编辑,并且原作品的互动数据如播放、点赞、转发和评论都将保留。站长网2024-07-30 08:53:570000最强开源多模态生成模型MM-Interleaved 支持任意穿插的图文输入和输出
要点:1、多模态生成大模型的新突破;2、独创特征同步器,刷新多项任务SOTA;3、可应用于多种图文生成及图像生成任务。近期,一项开源项目MM-Interleaved引起了学者的广泛关注,该模型在多模态生成大模型方面取得了新的突破。项目引入了独创的特征同步器,刷新多项任务SOTA,拓展了多种图文生成及图像生成任务的应用领域,为多模态大模型的发展提供了新的活力。站长网2024-02-01 14:56:070000创新性3D数据合成模型,微软推出EgoGen
随着AR、VR等设备的广泛应用,第一人称的应用开始增多。但在研发方面面临不同的挑战,例如,图像模糊、视觉混乱、遮挡更严重等,给视觉模型的训练带来重大挑战。一方面,人工标注真实第一视角数据集,来培训深度学习模型的成本和难度都很高。另一方面,以往用于第三人称视角的虚拟渲染数据,无法很好地模拟第一视角下的真实人体运动与环境交互过程。站长网2024-02-23 09:43:110001