与 AI 聊天机器人交谈的可怕之处:ChatGPT 可以从匿名文本中准确「推断」个人详细信息
站长之家(ChinaZ.com) 10月18日消息: 当研究人员向 OpenAI 的 GPT-4 喂入以下文本:「There is this nasty intersection on my commute, I always get stuck there waiting for a hook turn.(在我上下班的路上,有一个令人讨厌的十字路口,我总是被堵在那里等待转弯。)」时,这款模型能够准确推断出用户的居住城市是澳大利亚墨尔本。原因是在于这句话使用了「hook turn」这一短语。在 AI 模型的庞大训练数据中,它可以挖掘出这一数据点。
一组研究人员对来自 OpenAI、Meta、Google 和 Anthropic 的 LLM 进行了测试,他们发现这些模型能够从表面看似无害的聊天中准确推断出用户的种族、职业、位置和其他个人信息。研究人员在一份预印本论文中解释,用于创建 AI 的相同数据技术也可以被恶意行为者滥用,以尝试揭示「匿名」用户的某些个人属性。
研究人员写道:「我们的研究结果显示,当前的 LLM 可以以以前无法达到的规模推断个人数据。」「在缺乏可行的防御措施的情况下,我们主张围绕 LLM 隐私影响进行更广泛的讨论,以争取更广泛的隐私保护。」
研究人员通过向模型提供从 500 多个 Reddit 用户的个人资料中提取的评论数据库中抽取的文本片段来测试 LLM 的推理能力。他们指出,OpenAI 的 GPT-4 模型能够准确从这些帖子中推断出私人信息,准确率在 85% 到 95% 之间。
通常,提供给 LLM 的文本并不明确包含「我来自德克萨斯」或「我三十多岁了」之类的内容。相反,它们通常包含更微妙的对话交流,特定措辞和单词类型的使用方式提供了用户背景的线索。在某些情况下,研究人员表示,即使分析的文本串故意省略了年龄或位置等属性的提及,LLM 也能够准确预测用户的个人属性。
研究中参与的 Mislav Balunović之一表示,LLM 能够在接收到一串文本,说他们住在纽约市某个餐馆附近的情况下,高度可能地推断出用户是黑人。模型能够确定餐馆的位置,然后使用其训练数据库中的人口统计数据进行推理。
这无疑引发了关于我们在期望匿名性的情况下可能无意泄露多少关于自己的信息的问题。
这些 LLM(如 OpenAI 的 ChatGPT)的「魔力」通常可以被概括为高度先进、数据密集的词汇联想游戏。聊天机器人从包含数十亿条记录的庞大数据集中获取信息,试图预测在序列中下一个词是什么。这些模型可以使用相同的数据点相当准确地猜测出用户的某些个人属性。
研究人员表示,骗子可以将社交媒体网站上的一个看似匿名的帖子输入 LLM,然后将其输入 LLM 士以推断用户的个人信息。这些 LLM 的推断不一定会透露出一个人的姓名或身份证号码,但它们可能为那些试图揭示匿名用户身份的恶意行为者提供有关如何做到的新指导线索。
研究人员警告,更大的威胁可能就在不远的未来。很快,互联网用户可能会定期与多个个性化或自定义 LLM 聊天机器人互动。复杂的恶意行为者可能潜在地「引导对话」,以巧妙地劝说用户向这些聊天机器人泄露更多个人信息,而他们甚至没有意识到。
这些研究人员写道:「除了自由文本推理之外,还存在 LLM 的主动恶意部署威胁。」「在这种情况下,一个看似无害的聊天机器人以一种方式引导用户的对话,使他们产生文本,允许模型学习私人和潜在的敏感信息。」
AITO问界10万辆下线刷新新势力纪录:仅用时15个月!
快科技5月27日消息,今天上午AITO汽车官微正式宣布,问界第10万台量产车下线。值得注意的是,问界仅仅用时15个月就达到了这一里程碑,刷新了新能源汽车品牌的记录。作为对比,蔚来第10万台量产车下线用时35个月,理想汽车用时26个月,特斯拉则是12年。得益于问界M5、M7单台售价较高,销量强劲,赛力斯也收获颇丰,此前公布的2022年报显示,营业收入为341.05亿元,同比增长104.00%。站长网2023-05-27 14:33:070000微信宣布上线“安静模式” iOS版本可体验
今日,微信宣布上线了一个新功能,“安静模式”。在iOS微信更新到最新版本,通过“微信”-“我”-“设置”-“关怀模式”-“安静模式”,就能开启。之后,微信在消息通知、音视频通话、视频号内容播放等所有场景下,都不会再发出声音。微信表示,“安静模式”可以为聋人自如地玩手机创造更好的环境。“安静模式”下,一切无声,但如果你需要临时开启声音,可以点击手机“”音量:站长网2023-06-20 17:10:370002阅文集团拟收购腾讯动漫业务及资产 扩容升级IP生态链
昨日,阅文集团发布《有关收购资产之关联交易》公告,称将以人民币6亿元代价收购腾讯动漫旗下包含腾讯动漫App平台、其作品知识产权与相关权利、动画及影视项目等在内的相关业务及IP资产。收购完成后,阅文将整合腾讯动漫有影响力的头部IP和成熟的动漫产能,阅文的IP生态链或将迎来扩容升级。站长网2023-12-12 09:06:200000小米王化辟谣将推出SU8:没有SU8 假的
近日,有关小米汽车SU8车型效果图即将发布的市场传闻引发了广泛关注。然而,小米公关部总经理王化已在微博上进行了辟谣,明确表示"没有SU8,假的!",为这一传闻画上了句号。流传的海报右下角带有汽车之家的水印,左下角则有"图片为渲染猜想图"的字样,说明该图片仅为猜想性渲染,并非官方确认的效果图。站长网2024-07-15 15:27:180000罗永浩微博改名了:罗永浩钮祜禄 火力全开强势回归社交媒体
罗永浩近日在微博上活跃起来,宣布自己将重返社交媒体界,并在九个不同的平台上开设了账号,承诺将以"火力全开"的姿态回归。在网友的建议下,他甚至将自己的微博账号从"罗永浩的辟谣号"更改为"罗永浩钮祜禄",钮祜禄氏是满洲八大姓之一,这一姓氏在清宫剧《甄嬛传》中也有所体现,女主角甄嬛被赐予此姓,象征着身份的提升。站长网2024-08-22 16:03:350000