麻省理工研究员在机器学习模型隐私保护方面取得突破
最近,麻省理工学院的研究人员在保护机器学习模型中的敏感数据方面取得了重大突破。研究团队开发了一种机器学习模型,可以根据肺部扫描图片准确预测患者是否患有肺癌,但是与全球医院分享该模型可能会面临恶意代理人进行数据提取的风险。为了解决这个问题,研究人员引入了一种新的隐私度量标准,称为 “Probably Approximately Correct(PAC)Privacy”,以及一个确定保护敏感数据所需的最小噪音量的框架。
传统的隐私方法,如差异隐私,主要通过添加大量噪音来防止对手区分特定数据的使用,这会降低模型的准确性。PAC 隐私从不同的角度评估对手在添加噪音后重构敏感数据的困难程度。例如,如果敏感数据是人脸,差分隐私将防止对手确定数据集中是否存在特定个体的脸部。相反,PAC 隐私探讨的是对手是否能够提取出可以识别为特定个体脸部的近似轮廓。
为了实现 PAC 隐私,研究人员开发了一种算法,确定向模型中添加的最佳噪音量,以确保即使在对手具有无限计算能力的情况下也能保持隐私。该算法依赖于对手从原始数据的不确定性或熵的角度。通过对数据进行子抽样并多次运行机器学习训练算法,该算法比较不同输出之间的方差,以确定所需的噪音量。方差越小,表示所需的噪音越少。
PAC 隐私算法的一个关键优势是不需要了解模型的内部工作原理或训练过程。用户可以指定对手在重构敏感数据方面的置信水平,并且算法提供实现该目标所需的最佳噪音量。然而,值得注意的是,该算法不会估计由于向模型添加噪声而导致的准确性损失。此外,由于在各种子采样数据集上重复训练机器学习模型,实施 PAC Privacy 的计算成本可能会很高。
为了增强 PAC 隐私,研究人员建议修改机器学习训练过程以提高稳定性,从而减少子样本输出之间的方差。这种方法将减少算法的计算负担并最大限度地减少所需的噪声量。此外,更稳定的模型通常表现出更低的泛化误差,从而对新数据进行更准确的预测。
虽然研究人员承认需要进一步探索稳定性、隐私和泛化误差之间的关系,但他们的工作在保护机器学习模型中的敏感数据方面迈出了一大步。通过利用 PAC 隐私,工程师们可以开发出在保护训练数据的同时保持准确性的模型,适用于实际应用。借助减少所需噪音量的潜力,这种技术为医疗领域和其他领域中的安全数据共享开辟了新的可能性。
原论文地址:https://arxiv.org/abs/2210.03458
央视点赞国产AI复活召唤术,兵马俑竟与宝石老舅对唱Rap?
沉睡了两千多年的兵马俑,苏醒了?一句秦腔开场,将我们带到了黄土高原。如果不是亲眼所见,很多观众可能难以想象,有生之年还能看到兵马俑和宝石Gem同台对唱《从军行》。「青海长云暗雪山,孤城遥望玉门关。」古调虽存音乐变,声音依旧动人情:站长网2024-07-04 09:16:100000新型神经网络ResFields 擅长理解随时间变化的复杂 3D 场景
ResFields提出了一种新的神经网络结构,可以更好地表示复杂的时空信号。该方法的核心思想是在多层感知机(MLP)中替换一个或多个层,使用依赖时间的可训练残差权重参数。这种结构可以显著提升MLP的时空建模能力。项目地址:https://markomih.github.io/ResFields/站长网2023-09-13 10:26:490000内卷的咖啡,压垮失控的打工人
流水线作业,新时代的“进厂打螺丝”在一众全自动咖啡机面前,使用半自动咖啡机的Manner有他们自己的坚守。其创始人韩玉龙曾解释,“不想要机械化,不想抹杀掉每一个咖啡师的个性,这应该是一个有感情的行业。我们希望每一个咖啡师都有自己的客人和粉丝。我们也会有技术手段让咖啡的容错率更高。”然而现实是,每天300-500个咖啡订单面前,咖啡师最终沦为一个个没有感情的机器。站长网2024-06-29 22:14:310003Topaz发布高清修复软件Photo AI V2 降噪算法显著提升
要点:TopazLabs发布了全新版本的PhotoAI软件,包含大量改进和功能增强。PhotoAIV2在降噪和锐化算法上有显著提升,并引入了调整光线和颜色平衡功能。软件使用AI进行图像分析,可用于提升低分辨率图像、去除噪音、改善曝光不足或过度曝光等,具有广泛的应用。站长网2023-10-20 11:03:400001实测OPPO大模型手机:路人甲一抹就没,电话粥一键总结
都说2024会是AIAgent元年,杀手级应用将要出现。但就在开年,已经看到不一样的思路。与其做单个Agent应用,不如把系统能力提升为Agent级。不仅让大模型加持智能助手,还能让系统工具也具备AIGC能力。比如一键消除照片中的人群:让AI总结打电话内容:而且语音摘要处理全程加密,生成内容完全存储在本地。如上效果,都来自OPPO最新发布的FindX7系列。站长网2024-01-13 10:15:550000