与 AI 聊天机器人交谈的可怕之处:ChatGPT 可以从匿名文本中准确「推断」个人详细信息
站长之家(ChinaZ.com) 10月18日消息: 当研究人员向 OpenAI 的 GPT-4 喂入以下文本:「There is this nasty intersection on my commute, I always get stuck there waiting for a hook turn.(在我上下班的路上,有一个令人讨厌的十字路口,我总是被堵在那里等待转弯。)」时,这款模型能够准确推断出用户的居住城市是澳大利亚墨尔本。原因是在于这句话使用了「hook turn」这一短语。在 AI 模型的庞大训练数据中,它可以挖掘出这一数据点。

一组研究人员对来自 OpenAI、Meta、Google 和 Anthropic 的 LLM 进行了测试,他们发现这些模型能够从表面看似无害的聊天中准确推断出用户的种族、职业、位置和其他个人信息。研究人员在一份预印本论文中解释,用于创建 AI 的相同数据技术也可以被恶意行为者滥用,以尝试揭示「匿名」用户的某些个人属性。
研究人员写道:「我们的研究结果显示,当前的 LLM 可以以以前无法达到的规模推断个人数据。」「在缺乏可行的防御措施的情况下,我们主张围绕 LLM 隐私影响进行更广泛的讨论,以争取更广泛的隐私保护。」
研究人员通过向模型提供从 500 多个 Reddit 用户的个人资料中提取的评论数据库中抽取的文本片段来测试 LLM 的推理能力。他们指出,OpenAI 的 GPT-4 模型能够准确从这些帖子中推断出私人信息,准确率在 85% 到 95% 之间。
通常,提供给 LLM 的文本并不明确包含「我来自德克萨斯」或「我三十多岁了」之类的内容。相反,它们通常包含更微妙的对话交流,特定措辞和单词类型的使用方式提供了用户背景的线索。在某些情况下,研究人员表示,即使分析的文本串故意省略了年龄或位置等属性的提及,LLM 也能够准确预测用户的个人属性。
研究中参与的 Mislav Balunović之一表示,LLM 能够在接收到一串文本,说他们住在纽约市某个餐馆附近的情况下,高度可能地推断出用户是黑人。模型能够确定餐馆的位置,然后使用其训练数据库中的人口统计数据进行推理。
这无疑引发了关于我们在期望匿名性的情况下可能无意泄露多少关于自己的信息的问题。
这些 LLM(如 OpenAI 的 ChatGPT)的「魔力」通常可以被概括为高度先进、数据密集的词汇联想游戏。聊天机器人从包含数十亿条记录的庞大数据集中获取信息,试图预测在序列中下一个词是什么。这些模型可以使用相同的数据点相当准确地猜测出用户的某些个人属性。
研究人员表示,骗子可以将社交媒体网站上的一个看似匿名的帖子输入 LLM,然后将其输入 LLM 士以推断用户的个人信息。这些 LLM 的推断不一定会透露出一个人的姓名或身份证号码,但它们可能为那些试图揭示匿名用户身份的恶意行为者提供有关如何做到的新指导线索。
研究人员警告,更大的威胁可能就在不远的未来。很快,互联网用户可能会定期与多个个性化或自定义 LLM 聊天机器人互动。复杂的恶意行为者可能潜在地「引导对话」,以巧妙地劝说用户向这些聊天机器人泄露更多个人信息,而他们甚至没有意识到。
这些研究人员写道:「除了自由文本推理之外,还存在 LLM 的主动恶意部署威胁。」「在这种情况下,一个看似无害的聊天机器人以一种方式引导用户的对话,使他们产生文本,允许模型学习私人和潜在的敏感信息。」
大模型太卷,AI应用就好做吗?
2022年底,ChatGPT推出后迅速在社交媒体上走红,很快,月活用户突破1亿,成为史上增长最快的消费者应用。不久后,国内也掀起了一场轰轰烈烈的大模型竞赛,下场的企业越来越多,都在扬言要赶超ChatGPT。一年过去,大模型没让参赛者看到盈利的曙光,资本市场也在变冷,弄潮儿们发现:AI应用或许比大模型更有机会。站长网2023-12-07 15:58:04000111.83亿元!顺丰向极兔转让丰网100%股权
快科技5月12日消息,今晚顺丰控股发布公告称,下属控股子公司深圳市丰网控股有限公司(以下简称丰网控股”)与极兔速递下属子公司深圳极兔供应链有限公司签署了《股权转让协议》。丰网控股拟以人民币11.83亿元转让全资子公司深圳市丰网信息技术有限公司(以下简称丰网信息)100%股权。深圳丰网速运有限公司是丰网信息下属全资子公司,在2020年正式成立,2020年9月丰网速运开始提供快递服务。站长网2023-05-13 09:15:320000三星报告利润增长10倍,AI 推动内存芯片市场复苏
划重点:⭐三星电子上季度营运利润增长10倍,主要受益于人工智能技术的发展,推动计算机内存芯片市场复苏。⭐半导体业务首次实现季度盈利,预计内存芯片市场将在未来几个月保持强劲增长,受益于AI技术的扩展。⭐三星将继续专注于提升旗舰产品GalaxyS24的销售,该产品集成多项由AI驱动的新。站长网2024-04-30 15:53:400000抖音回应进军基金销售:目前没有申请基金销售牌照
据中国基金报报道,近期抖音联合部分头部基金公司进行了基金销售的相关测试,并且与一些公司共同探讨未来基于抖音生态开展基金销售的业务模式。抖音已经做好基金销售前期准备工作,静待业务资格正式获批。具体代销业务开展而言,抖音入局基金销售的第一步便是牵手基金公司旗下货币基金,后续再逐渐扩展到非货代销业务领域。针对上述消息,对此,抖音集团回应称,目前没有申请基金销售牌照,也没有和基金公司进行测试。站长网2023-07-20 11:07:540000AI视野:英特尔首款AI PC处理器发布;腾讯开源StableDiffusion插件LightDiffusionFlow;百度发布医疗大模型;妙鸭相机推出免费体验版
🤖📈💻💡大模型动态DeepMind再放大招!新模型可预测基因突变是否致病DeepMind发布AlphaMissense模型,能预测基因错义突变是否致病,提升近千倍于人类专家,成功分类7100万突变中89%的致病性,加强遗传病诊断和新致病基因发现。论文地址:https://www.science.org/doi/10.1126/science.adg7492站长之家提要:站长网2023-09-20 15:11:440000