研究发现大型 AI 数据集包含虐待儿童图像:该数据集已用于构建流行的人工智能图像生成器,包括 Stable Diffusion
根据斯坦福互联网观察站周三发布的一项新研究,流行的人工智能(AI)图像生成器的基础数据库中隐藏着数千张儿童性虐待图片(CSAM)。作为对这一研究的回应,一些最大和最常用的图像数据库的运营商关闭了对它们的访问权限。
斯坦福大学的这个监督团队与加拿大儿童保护中心以及其他反虐待慈善机构合作,在巨大的 AI 数据库 LAION 中发现了超过 3200 张涉嫌儿童性虐待的图片,并向执法部门报告了原始照片链接。其中 1000 多张涉嫌图片被确认为儿童性虐待材料。
研究者们写道:「我们发现即使在 2023 年晚些时候,拥有 LAION-5B 数据集也意味着拥有数千张非法图片。」
对此,LAION 在斯坦福互联网观察站报告发布前夕做出了迅速反应,宣布暂时撤下其数据集。LAION(代表非营利性的大规模人工智能开放网络)在一份声明中表示,「我们对非法内容采取零容忍政策,出于谨慎考虑,我们已撤下 LAION 数据集,以确保在重新发布之前它们是安全的」。
尽管这些图片只占 LAION 约 58 亿张图片指数的一小部分,斯坦福团队表示,这可能影响 AI 工具生成有害输出的能力,并加剧对多次出现的实际受害者的先前虐待。
研究人员表示,这些图片还使 AI 系统更容易生成虚假儿童的逼真和明确的图像,以及将社交媒体上完全穿着衣服的真实青少年的照片转换为裸体照片,这让全世界的学校和执法部门感到震惊。直到最近,反虐待研究人员认为,一些未经检查的 AI 工具产生虐待儿童的图像的唯一方式是通过结合两类在线图片——成人色情和对孩子的无害照片。
斯坦福互联网观察站呼吁采取更为激进的措施。其中之一是要求所有基于 LAION-5B(包含超过 50 亿张图像文本对)构建训练集的人「删除它们或与中间商合作清理材料」。另一个措施是实际上让去年推出的 Stable Diffusion 的旧版本从互联网上最黑暗的角落消失。
斯坦福互联网观察站的首席技术官 David Thiel 表示:「合法平台可以停止提供它的下载,特别是如果它们经常用于生成虐待图像并且没有阻止它们的保障措施。」
解决这个问题并不容易,可以追溯到许多生成性 AI 项目「实际上被匆忙地推向市场」并且由于该领域竞争激烈而广泛可用,Thiel 说。
「将整个互联网的抓取数据集用于训练模型本应该限于研究操作,如果有的话,而不是在没有更多严格关注的情况下开源,」Thiel 在接受采访时说。
影响 LAION 数据集开发的一个主要 LAION 用户是总部位于伦敦的初创公司 Stability AI,该公司制作了 Stable Diffusion 文本到图像模型。根据斯坦福报告,Stable Diffusion 的新版本已大大降低了生成有害内容的可能性,但去年推出的旧版本(Stability AI 表示它没有发布)仍然嵌入到其他应用程序和工具中,并且仍然是「生成明确图像的最受欢迎的模型」。
「我们无法撤回这一模型。这个模型已经在许多人的本地机器上被人们所拥有,」加拿大儿童保护中心信息技术主任 Lloyd Richardson 说。该中心运营着加拿大网络性剥削举报热线。
Stability AI 周三表示,它只托管过滤后的 Stable Diffusion 版本,并且「自从接管 Stable Diffusion 的独家开发以来,Stability AI 已采取积极措施来减少滥用风险」。
「这些过滤器阻止了不安全内容到达模型,」该公司在一份准备好的声明中说。「通过在内容到达模型之前将其移除,我们可以帮助防止模型生成不安全内容。」
LAION 本周表示,它开发了「严格的过滤器」来检测和移除非法内容,然后才发布其数据集,并仍在努力改进这些过滤器。斯坦福报告承认,LAION 的开发者试图过滤掉「未成年」的露骨内容,但如果他们早些时候与儿童安全专家协商,可能会做得更好。
许多文本到图像生成器都以某种方式从 LAION 数据库派生而来,尽管并不总是清楚是哪些生成器。Dall-E 和 ChatGPT 的开发商 OpenAI 表示,它没有使用 LAION,并对其模型进行了微调,以拒绝涉及未成年人的色情内容的请求。
Google 基于 LAION 数据集构建了其文本到图像 Imagen 模型,但在 2022 年决定不公开发布,原因是对数据库进行的审计「发现了大量不当内容,包括色情图像、种族主义辱骂和有害的社会刻板印象」。
LAION 的创始人是德国研究员和教师 Christoph Schuhmann,他今年早些时候表示,公开提供如此庞大的视觉数据库的部分原因是为了确保 AI 发展的未来不受少数强大公司的控制。
推特将允许用户从eToro购买和出售股票和其他资产
推特将与eToro合作,让用户访问并交易股票、加密货币和其他金融资产。eToro透露,从当地时间周四晚些时候开始,推特应用程序将推出一项新功能,该功能允许用户查看更多金融工具的市场图表,并从eToro平台上买卖股票和其他资产。站长网2023-04-15 09:58:560000高通预热 2023 骁龙峰会:和骁龙一起,让 AI 触手可及
高通官方微博今日对将于10月25-26日举行的2023骁龙峰会进行了预热,预计本次大会将以AI为主题,届时骁龙8Gen3处理器有望亮相。图片来自@高通高通官方表示:「当世界走进AI时代,骁龙让AI走近你。骁龙的人工智能让触动人心的移动体验加速到来,从手机,到PC,再到音频,全方位颠覆你的感官。和骁龙一起,让AI触手可及。」站长网2023-10-16 23:51:130000快手不再那么需要辛巴
超级主播话语权的减弱,让他们与平台之间的关系,变得愈发微妙起来。4月20日,辛巴在直播过程中怒怼快手。当天,快手就将辛巴个人账号封禁一个月。这是快手近三年对辛巴封禁时间最长的一次。频频对快手讲出出格言论的辛巴有流量焦虑,而快手电商正在从超级主播带货转向货架模式,它对辛巴这类超级主播的依赖性在降低。0001联合国研究:AI不太可能破坏就业,但某些员工可能付出“惨痛”代价
本文概要:1.联合国国际劳工组织的一项研究称,AI更有可能增强现有工作,而不是完全取代它们,但某些角色,如文书工作,其任务可能比其他角色自动化更多。2.根据研究,文员工作具有24%的高度自动化风险,另外58%具有中等水平风险。打字员、旅行顾问、银行出纳员等角色风险较大。3.该研究认为,AI的整体影响既不特别积极也不特别消极,其影响将取决于如何管理和规范GPT。站长网2023-08-22 18:50:300000DeepMind创始人:生成式AI只是过渡,AI未来将获得自由,交互式AI将改变人类
在最近MIT科技评论的专访中,DeepMind联创,InlfectionAI创始人表示,他们已经将AI毒性去除,生成式AI只是过渡,未来AI将获得像人一样的自由。DeepMind的联合创始人,InflectionAI的创始人,MustafaSuleyman接受了MIT科技评论对他进行了一次线上专访,在专访中,他抛出观点:站长网2023-10-05 09:14:570000