ChatGPT泄露陌生男子自拍照!隐私数据被模型偷了?网友大恐慌
【新智元导读】原来,这竟然也是ChatGPT的幻觉?
最近,ChatGPT响应中蹦出陌生男子照片事件,让许多网友们震惊了!
事情是这样的,一名用户向ChatGPT求助——Python中的代码格式化包back该怎样使用。
开始,ChatGPT的回答还很正常。
谁料想,ChatGPT忽然就在响应中,发出了一张陌生男子的自拍照!
而且还出现了第二次!
网友们立刻陷入恐慌。
莫非ChatGPT现真身了?
有人猜,这不会又是一个AI中的幽灵吧?
或许是ChatGPT的恐怖女士男人版?
有人想起了这样一个传说:在互联网上有大量隐藏在潜伏空间中的东西,这涉及到很多理论。
还有人猜,没准是ChatGPT被下毒了!
或者有人黑进了OpenAI,让ChatGPT随机发布自己的照片,作为战果来炫耀。
答案出乎意料
网友们集思广益,到处搜集线索,终于破案了!
这不是ChatGPT生成的照片,而是一个用户的真实自拍照。
原来,这种照片在2016年12月7日被传到Imgur上。(这张图片本来的浏览量在几百,但是随着越来越多群众围观此次事件,目前的浏览量已经变成17000多次了。)
有人猜测,事情应该是这样的:ChatGPT在生成响应的时候,随机生成了一个Imgur URL,碰巧就链到了这个自拍小伙。
ChatGPT的目标就是生成一张说明的图片,它以为自己在分享Visual Studio Code设置的截图,没想到通过Imgur链接生成的是图片。
也就是说,在ChatGPT的训练数据集之中,有许多答案包含了指向部分答案的Imgur链接,所以Imgur链接和正确答案高度相关。
但是,ChatGPT无法以统计方式自动完成随机图像链接,所以结果是不可预测的。这个小伙的照片,类似于GPT的幻觉页码。
另外一个网友也给出了类似解释:ChatGPT生了一个答案,是一个Imgur链接。
它想到了自己应该提供带答案的Imgur链接,但没有意识到自己需要的是相同的Imgur URL,相反,它竟然生成了一组随机URL。
而巧的不能再巧的是,这居然是一个有效的链接,正好链到了外国小伙的照片上。
也有人说,并不是Imgur被用于训练,而是ChatGPT能够生成Imgur链接(实际上可以说的任何链接)。
所以说,这个链接是ChatGPT随机生成的,这件事可能性有多大?
有人算出来,Imgur图像ID是由集合 [A-Za-z0-9] 中的7个字符组成,所以有 62^7=3,521,614,606,208,也就是3.5万亿种可能的组合。
Igmur在2014年第一轮融资期间,托管了大概6.5万亿张图像。推算一下,自2014年以来,互联网上创建的数据量激增了860%。按照这个逻辑,Imgur现在可以托管大约62.4亿张图像。
因此,ChatGPT猜到有效图像ID的几率是——
6.24B /62^7x100=0.177%
大概在每565次聊天中,这种事就会发生一次,所以要是说ChatGPT生成这个Imgur链接,倒也是不无可能。
层主特意写了一个简单的脚本来测试这些数字,在发出的10000个请求中,它找到了19个有效图像,所以概率是0.19%。顺便还秀了一把恩爱?
到这里,事情似乎水落石出了。
所以,要谨记自己上传或者输入的内容都会被用于训练ChatGPT,如果不想泄露隐私,切记要把上传聊天纪录的按钮关闭。
并且,任何你在互联网上留下的数字足迹,都有可能在某一天变成AI的训练数据。
总之,千万不要什么照片都发给AI,你根本搞不清它会拿你的照片去做什么。
参考资料:
https://twitter.com/thealexker/status/1719896871009694057
特斯拉否认换代Model 3即将国产:消息不实
据第一财经消息,针对“特斯拉换代Model3将于6月1日将在上海量产”的报道,特斯拉中国方面否认了该消息的真实性。据了解,特斯拉Model3在北京时间2016年4月1日11点30分在美国发布。截止目前,特斯拉Model3后驱版在中国的售价为23.19万元,Model3高性能版售价33.19万元。站长网2023-05-09 15:38:030000Sam Altman 重新掌舵 OpenAI,新一届董事会迎来重大变革
经历数日危机与混乱后,SamAltman重返OpenAI担任首席执行官。OpenAI董事会经历重大调整,三位新成员取代了先前罢免Altman的领导层。据报道,OpenAI新董事会尚未最终确定。目前正在与微软及其他重要投资方进行谈判,以确定其在董事会中的代表权。微软此前已向OpenAI投资数十亿美元。站长网2023-11-23 09:09:080000微软正在与AMD合作开发Athena AI芯片组
据彭博社报道,微软正在帮助资助AMD向AI芯片领域的扩张。同时,AMD正在与微软合作,为这家软件巨头的数据中心开发代号为Athena的内部芯片组。据了解,Athena旨在成为目前主导该市场的英伟达AI芯片组的经济高效替代品。站长网2023-05-05 09:44:590000南京大学发布AvatarBooth 可用文本生成3D人类化身
过去,元宇宙曾经大热,但之后却被冷落。一个很大的原因是生成3D化身的方法大多需要昂贵且复杂的采集设备,以构建高保真的化身模型。因此,对于消费级别的应用开发来说难以负担。站长网2023-06-28 15:35:250000