麻省理工学院研究人员在机器学习模型隐私保护方面取得突破
站长网2023-07-21 12:09:286阅
麻省理工学院的研究人员通过引入一种新的隐私度量标准和一个确定所需噪音最小量的框架,取得了保护机器学习模型中敏感数据的突破。
传统的隐私保护方法往往通过添加大量噪音来防止对特定数据的识别,但这会降低模型的准确性。而新的隐私度量标准 “Probably Approximately Correct (PAC) Privacy” 则从不同的角度考虑,评估了对手在添加噪音后重构敏感数据的难度。
为了实现 PAC 隐私,研究人员开发了一个算法,根据对手的观点计算原始数据的不确定性或熵,并通过对多次运行机器学习训练算法的子采样数据进行比较,确定所需噪音的最佳量。
该算法不需要了解模型的内部工作机制或训练过程,并且可以根据用户对对手重构敏感数据能力的要求提供最佳噪音量。然而,该算法并不估计添加噪音对模型准确性的损失,而且由于需要反复在多个子采样数据集上训练机器学习模型,实现 PAC 隐私可能会导致计算成本较高。为了提高 PAC 隐私的效果,研究人员建议修改机器学习训练过程以增加稳定性,从而减少子采样输出之间的方差。这种方法可以降低算法的计算负担,并减少所需噪音的量。
此外,更稳定的模型通常表现出更低的泛化误差,从而可以在新数据上进行更准确的预测。通过利用 PAC 隐私,工程师可以开发出在保护训练数据的同时保持准确性的模型,从而在实际应用中实现安全的数据共享。
0006
评论列表
共(0)条相关推荐
报告:2023年第一季度全球PC出货量同比下降28%
CounterpointResearch公布数据称,2023年第一季度,全球PC出货量为5,670万台,年同比下降28%,成为过去10年来,除2020年第一季度因新冠疫情爆发中断制造和生产外,出货量最低的季度。站长网2023-04-20 09:23:390000巨人网络发布2023年报:称将持续研究GiantGPT应用场景
4月29日,巨人网络发布2023年年度报告及2024年一季度报告。报告显示,2023年公司实现营业收入29.24亿元,同比增长43.50%,实现归属于上市公司股东的净利润10.86亿元,同比增长27.67%;实现归属于上市公司股东的扣除非经常性损益的净利润13.73亿元,同比增长34.84%。站长网2024-04-30 10:22:040000GitHub放大招!CEO现场挑战18分钟开发小游戏,人还在台上网友已经玩到了
GitHubCEO,直播AI写代码,挑战18分钟完成一个小游戏。结果只用了不到15分钟,直接成功在线部署,这边人还在讲台上,全球网友已经能玩上了。整个项目从一片空白的新建文件夹开始。全程只需要提出需求,看AI表演,然后一键导入代码,连CtrlC、CtrlV都省了。超额完成任务,节省下来的时间还可以用来演讲,以实际行动说明了什么叫“10倍程序员”。站长网2023-05-04 15:06:520001苹果首款空间计算设备 Vision Pro 可能要经历四代迭代才能达到「理想状态」
据彭博社MarkGurman透露,苹果视觉产品部门的部分员工认为,要让苹果首款空间计算头显设备VisionPro达到「理想状态」,可能需要经过四代产品的连续改进。在其最新发布的PowerOn简报中,Gurman表示,参与VisionPro研发的团队认为,要使这款设备达到日常使用的精致程度,还有许多工作要做。站长网2024-02-12 11:11:000000风投界再变得疯狂:见一家小型AI公司创始人要交100美金
导语:这是人工智能初创市场泡沫化的一个迹象。风险投资行业在过去一年里大多是一幕悲伤的故事,成千上万的初创公司难以筹集资金,许多公司关门大吉。然而,对于一些幸运的创始人来说,市场依旧泡沫化。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-03-07 15:51:140000