Nightshade 工具助力创作者保护版权 对抗 AI 训练数据的滥用
站长之家(ChinaZ.com) 10 月 26 日消息:随着人工智能(AI)技术的快速发展,其训练数据的获取和使用变得日益重要,但也出现了滥用现象。为了抵御这种滥用,一款名为「Nightshade」的新工具应运而生,为创作者提供了一种保护他们创意作品不被无授权用于 AI 模型训练的方法。
Nightshade 工具使得用户能够将其附加到他们的创意作品上,从而在使用该作品进行训练时「毒化」AI 模型的数据。通过对数字艺术作品的像素进行不可见的修改,Nightshade 能够在作品被 AI 模型训练时利用安全漏洞对模型造成混淆。例如,它可以让模型无法识别汽车图像,反而识别为牛的图像。最终,这种毒化数据可以破坏诸如 DALL-E、Stable Diffusion 和 Midjourney 等 AI 艺术平台的未来模型,剥夺其生成图像的能力。
《麻省理工学院科技评论》报告称,芝加哥大学教授兼 Nightshade 的创建者之一 Ben Zhao 希望通过这款工具,改变目前 AI 公司借助侵权数据训练模型的现状。Nightshade 的研究论文指出,文本至图像的 AI 模型很容易受到这种攻击的影响。
创作者可通过上传他们的作品到 Nightshade 创建者开发的另一款工具 Glaze 中,保护其艺术风格不被模仿。例如,Glaze 可以将通常的现实主义绘图转变为立体主义风格。未来,Nightshade 将被集成到 Glaze 中,让用户选择是否使用「毒丸」,或满足于模型无法模仿他们的艺术风格。
Nightshade 的创建者在论文中提议,应将 Nightshade 及类似工具作为保护创作者免受不遵守退出规则的网络爬虫侵害的「最后防线」。
目前,围绕 AI 生成内容和训练数据的版权问题在缺乏相关法规的情况下仍然是一个灰色地带。许多与版权侵权战斗的诉讼仍在法庭上进行。同时,防止网络爬虫未经许可获取数据的方法也受到了限制。Adobe 公司计划使用标记来标识是否为 AI 生成的内容,同时显示图像的所有者。
最初针对生成性 AI 平台的一些诉讼集中在版权材料被无授权用于模型训练上,特别是在文本至图像平台方面。今年 1 月,三名艺术家分别起诉了 Stable Diffusion、Midjourney 和艺术网站 DeviantArt,声称其模型未经许可使用了他们的艺术作品。Getty Images 也在构建自己的基于许可图像训练的 AI 图像生成器之前,对 Stable Diffusion 提起了诉讼。
谷歌和微软表示,如果客户在使用他们的生成性 AI 产品时因侵犯版权而被起诉,他们愿意承担法律责任。然而,大多数这些产品都是基于文本的。
WeWork中国:WeWork中国是独立品牌 与WeWork申请破产无关
据国外媒体报道,美国“联合办公空间”公司WeWork计划最早在下周申请破产。WeWork创办于2010年,一度被誉为“未来办公空间的代表”。消息发布后,“共享办公”这种商业模式受到广泛关注和讨论,WeWork股票价格在当天盘后交易中下跌32%。然而,WeWork中国似乎未受影响。在2020年全面实现本土化运营后,WeWork对中国市场积极布局,今年分别在武汉、上海、北京陆续开幕新社区。站长网2023-11-07 14:50:400000OpenAI计划重磅更新 应用程序开发成本可降低20倍
要点:OpenAI计划在下个月进行重磅更新,以更低价格、更快的方式帮助开发人员构建专属ChatGPT,包括增加内存存储功能,可以降低应用程序成本。这一更新解决了合作伙伴通过开发、销售AI软件建立业务时需要支付高昂的ChatGPT模型成本的问题。OpenAI还计划推出新的视觉开发工具,用于构建具有图像分析和描述能力的应用程序,适用于医疗、金融、电商、娱乐等领域。站长网2023-10-12 09:00:420000B站播放次数改为播放分钟 预计未来几周内完成更新
在昨晚的B站14周年庆直播中,B站董事长兼CEO陈睿宣布,B站播放次数将改为播放分钟,计划在未来几周内完成产品更新。陈睿解释称,播放分钟数比播放次数更能反映视频的质量,但统计播放分钟数的技术复杂度更高,成本更高。幸运的是,随着技术的成熟,现在B站已经有能力统计播放分钟数,替代B站播放次数作为外显数据,使用户有更好的参考。站长网2023-06-28 15:35:300000英文训练AI大模型比中文更便宜,可为什么会这样?
如今国内市场的“百模大战”正如火如荼,无论是BAT这样的传统豪强,还是美团、字节跳动这样的新兴巨头,乃至科大讯飞等传统AI厂商都已入局。但提到AI大模型,似乎大家还是认为ChatGPT、BingChat、Bard等海外厂商的相关产品往往更加好用。事实上,这并非错觉。近期牛津大学进行的一项研究就显示,用户所使用的语言对于大型语言模型(LLM)的训练成本有着密切的联系。站长网2023-08-04 15:34:090000人工智能用于 SEO 内容创作:LinkedIn、CNET 和 The Verge 等 5 个网站真实案例
SearchEngineLand日前发布了用于搜索引擎优化(SEO)的人工智能内容创作的5个真实案例,展示了LinkedIn、CNET、Bankrate等公司使用AI以提高内容生产效率,也更深入地让人们了解AI在SEO领域的应用现状。站长网2023-11-23 16:47:100000