AI研究者成功通过“诗歌攻击”揭示ChatGPT的训练数据来源
**划重点:**
1. 🕵️♂️ 由Google Deepmind、华盛顿大学等机构的研究团队发现,Chat GPT曝露了从CNN、Goodreads到个人信息等多来源的训练数据。
2. 🛑 攻击手法为“诗歌攻击”,通过重复某个词汇使Chat GPT透露私密信息,包括电话号码、邮箱等,研究者已于8月30日通知Open AI并得到修复。
3. ⚡ 研究同时指出,生成AI文本和图像消耗的能源相当巨大,对环境带来负担,研究呼吁更环保的AI使用方式。
来自 Google Deepmind、华盛顿大学、康奈尔大学、卡内基梅隆大学、加州大学伯克利分校和苏黎世联邦理工学院的一组研究人员成功地让 Open AI 的聊天机器人 Chat GPT 揭示了用于训练 AI 模型的一些数据。
研究团队使用了一种创新性的手法,即通过不断迭代地要求Chat GPT重复一个特定的词汇,比如“诗歌”,来引导模型透露其训练数据。随着反复迭代,Chat GPT最终开始输出与训练数据相关的信息。这包括来自CNN、Goodreads、Wordpress博客、Stack Overflow代码、Wikipedia文章等多个来源的文本内容。
图源备注:图片由AI生成,图片授权服务商Midjourney
更令人担忧的是,Chat GPT还被发现包含了大量从互联网上爬取的私人信息,这些信息甚至可以通过Chat GPT-3.5turbo的公开版本获得。攻击揭示的私密信息包括电话号码、传真号码、邮箱地址、物理地址、社交媒体用户名、网址、姓名和生日等。
研究人员表示,他们在8月30日通知了Open AI关于这一漏洞,并Open AI自那时起对其进行了修复。截至目前,Open AI尚未进一步评论此事。
值得注意的是,研究还涉及到AI生成文本和图像所消耗的能源问题。研究人员发现,使用AI模型生成1,000张图像的能耗相当于将手机充满电,而生成1,000次文本则相当于将手机充电至16%。该研究呼吁更加环保的AI使用方式,并指出大型、广泛应用的AI模型消耗的能源更多,因为它们试图同时执行多项任务,而非专注于特定任务。
这一研究为我们敲响了警钟,提醒我们在推动AI发展的同时,需谨慎处理其隐私和能源消耗的问题。
WriteHuman:绕过AI检测,将AI生成内容转换成人类书写内容
由于人工智能的发展,AI生成的文本在很多领域都被大量应用了。但我们同样也有了一些担心,比如内容真实性和原创性。那么我们怎么才能保证AI生成的文本不被检测出来呢?这就是WriteHuman想要做到的。WriteHuman是一款革命性的工具,并且改变了人们在人工智能生成内容领域一直以来的规则。它可以将人工智能生成的文本转换为无法检测的人类书写内容站长网2023-10-12 17:02:150000研究:人工智能缩短中风治疗时间,死亡率降低60%
文章概要:-人工智能软件显著提高中风患者大血管梗塞的检测速度,减少治疗时间,可能改善治疗结果。-在四家综合性中风中心进行的临床试验中,该自动化系统与60%的死亡率下降相关。-与未使用该系统的对照组相比,门诊到体内血管成形术时间缩短11分钟。站长网2023-09-22 11:50:180000中文大模型比英文更烧钱,这居然是AI底层原理决定的?
ChatGPT等AI工具的使用正越来越普遍。在与AI交互时,我们知道,输入的提示词差异会对输出结果产生影响。那么,如果相同意思的提示词,用不同语言分别表述,结果差异是否较大?另外,提示词的输入和输出是和模型背后的计算量直接挂钩的。因此,不同语言之间在AI输出和成本消耗方面是不是有着天然的差异性或者说是“不公平性”?这种“不公平性”又是如何产生的呢?站长网2023-09-07 09:01:330000知乎带货之心不死
11月29日,知乎发布截至2023年9月30日未经审计的季度财报业绩。知乎第三季度总收入为10.22亿元,同比增长12.1%,经调整净亏损同比收窄10.1%,毛利率从去年同期的48.7%提高至53.7%。分业务来看,营销服务营收3.83亿元,同比减少17.1%;付费会员营收4.67亿元,同比增长39.2%;职业培训营收1.45亿元,同比增长85.6%;其他营收2762.2万元,同比减少24%。站长网2023-12-01 18:19:490000没想到,以后刷朋友圈也得看直播带货了
微信不再克制。视频号直播可以投放朋友圈了没人能躲得了直播带货。近日,微信广告上线了一个重磅新功能:视频号直播广告通投能力。通俗来讲,以后商家在视频号发布短视频或直播时,可以将内容直接同步投放到“公域”朋友圈。站长网2024-01-12 14:14:550000