研究人员开发过滤器处理不安全的AI生成图像
**划重点:**
1. 📷 AI图像生成器在过去一年变得异常流行,但也带来了不安全图像的问题,包括淫秽和令人不安的内容。
2. 🚫 研究人员通过对四个知名AI图像生成器进行测试,发现其中14.56%的生成图像被定义为“不安全图像”,其中以Stable Diffusion生成器的18.92%最为突出。
3. 🔍 为了解决这一问题,研究人员提出了三种解决方案,包括在训练阶段筛选数据、规范用户输入提示以及在图像生成后分类和删除不安全图像。
近年来,AI图像生成器因其便捷性而变得异常受欢迎,但也引发了一系列问题。在CISPA Helmholtz信息安全中心的研究中,研究员Yiting Qu探讨了这些图像生成器中存在的不安全图像问题,并提出了一种用于解决此问题的过滤器。
她一篇论文中指出,用户通过所谓的文本到图像模型,如Stable Diffusion、Latent Diffusion或DALL·E,可以通过输入特定文本信息生成数字图像。然而,Qu发现一些用户将这些工具用于生成色情或令人不安的图像,尤其是当这些图像在主流平台上广泛传播时,问题更为突出。
为了解决这一问题,研究人员对四个最知名的AI图像生成器进行了测试,包括Stable Diffusion、Latent Diffusion、DALL·E2和DALL·E mini。通过使用特定集合的文本输入提示,其中包括来自4chan和Lexica网站的内容,他们发现在所有生成器中,有14.56%的生成图像被定义为“不安全图像”,而Stable Diffusion的比例最高,达到18.92%。
为了应对这一问题,Qu提出了三种解决方案。首先,开发人员在训练或调整阶段应筛选训练数据,减少不确定图像的数量。其次,规范用户输入提示,例如删除不安全关键词。最后,对于已经生成的不安全图像,需要一种方式对这些图像进行分类和在线删除。这也需要平台上的过滤功能来实现。
Qu指出,尽管防止图像生成是一种方式,但更重要的是沿着文本到图像模型的供应链采取综合性的措施。她表示,自己开发的过滤器在防止不安全图像生成方面取得了更高的命中率,但仍需要在自由和内容安全之间找到平衡。她希望通过这项研究帮助减少未来互联网上流传的有害图像数量。
论文网址:https://techxplore.com/journals/arxiv/
腾讯把我的公众号,变成了一个巨大的“数字生命”。
去年11月,我第一次推荐Kimi的时候,就是因为我想做一个数字分身,把我写过的所有公众号文章,当作一个知识库,让AI来解答各种乱七八糟的问题。参见:当我把我的100篇文章喂给AI-坏了,我成数字生命了?而那时候Kimi的长文本效果确实好,但是有个很大的问题,就是,用起来真的好麻烦。站长网2024-09-23 01:15:320001航旅纵横发布民航领域垂直大模型“千穰大模型”
航旅纵横发布了首个民航领域垂直大模型——千穰大模型。该大模型基于Transformer架构,构建了10亿、100亿、300亿等多种参数模型,融合了视觉大模型、语言大模型、多模态大模型和计算大模型,通过强大的人工智能技术,为民航产业的数智化建设和旅客的智慧出行提供支持。站长网2023-08-26 17:01:250001反套路的“新套路”?剧情达人借短剧翻红,广告接到手软
一句“真是服了你们这群颠公颠婆”,让“王妈”一跃成为短视频界的新顶流。王妈是谁?她是剧情达人“七颗猩猩”《重生之我在霸总短剧里当保姆》系列短剧中塑造的NPC之一,一个让被迫卷入霸总短剧言情桥段、还敢直面“颠公颠婆”,并精准吐槽、获得打工人狠狠共情的保姆角色。因“王妈”而爆火出圈后,“七颗猩猩”2个月涨粉近700万,广告接到手软,成为了短剧风口下吃到红利的代表性短视频达人。站长网2024-05-04 17:36:310000AI阅读陪练初创公司Ello融资1500万美元 以提高儿童识字能力
文章概要:1.AI初创公司Ello获得1500万美元A轮融资,提供基于人工智能和语音识别技术的阅读辅导服务,旨在帮助儿童提高阅读能力。2.Ello提供订阅服务,每月以24.99美元向幼儿园至三年级的儿童提供五本书,并利用独有的技术监听孩子的朗读,纠正发音错误,以及提供额外帮助。3.公司计划扩大产品覆盖范围,与学校合作,开发适用于课堂的产品,并推出多语言版本。站长网2023-09-08 15:01:080001腾讯宣布微信支付免除单笔交易200元及以下国际卡交易手续费
腾讯近日宣布与Visa、DiscoverGlobalNetwork、JCB、Mastercard等国际卡组织深化合作,全面开放微信支付商户网络,为境内各城市的商户提供移动支付服务。入境人士通过护照或相关证件开通微信支付,并绑定国际银行卡,即可在逾千万家商户便捷消费。站长网2023-07-20 16:55:560000