微软在开发AI模型时泄露了38TB敏感数据

站长网2023-09-19 10:22:210阅

要点：

微软在GitHub公共存储库上错误使用Azure平台的共享访问签名令牌（SAS），导致38TB的私人数据泄露，包括密码、密钥和内部消息。

SAS令牌的不当使用和缺乏监控以及管理，使得数据泄露风险增加，难以追踪。

高度依赖大规模数据的AI模型训练过程需要更强的安全措施和协同工作，以防止类似的事件再次发生。

微软近期的数据泄露事件凸显了AI模型训练过程中的安全风险和挑战。这一事件发生在GitHub公共存储库上，由于错误使用Azure平台的共享访问签名令牌（SAS），导致了38TB的私人数据泄露。

微软的AI研究人员通过一个权限过于宽松的SAS令牌在GitHub上分享文件，其中包括用于图像识别的开源代码和AI模型。然而，SAS令牌的危险在于缺乏监控和管理，因此难以追踪和控制。这使得微软的数据曝露了数年之久，严重威胁了数据的安全性。

图源备注：图片由AI生成，图片授权服务商Midjourney

除了用于AI模型训练的数据，微软还泄露了两名员工工作站的磁盘备份，其中包括了“秘密”、私人加密密钥、密码以及属于359名微软员工的超过30，000条内部Microsoft Teams消息。总计有38TB的私人文件可能被任何人访问，直到微软于2023年6月24日吊销了危险的SAS令牌。

这次事件突显了SAS令牌的安全风险，因为它们缺乏监控和治理。Wiz指出，应尽量限制SAS令牌的使用，因为微软没有提供通过Azure门户进行集中管理的方式。

此外，SAS令牌可以配置为“实际上永久有效”，这使得难以追踪和控制其使用。首个微软提交到其AI GitHub存储库的令牌于2020年7月20日添加，有效期一直延续到2021年10月5日。随后又添加了第二个令牌，有效期设置为2051年10月6日。

总之，微软的这一多TB数据泄露事件凸显了AI模型训练的风险。这种新兴技术需要大规模的数据来进行训练，许多开发团队需要处理大量数据，与同行分享数据，或者参与公共开源项目的合作。然而，类似微软的事件变得越来越难以监控和避免，因此需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

微软在开发AI模型时泄露了38TB敏感数据

0000

评论列表

共(0)条

相关推荐

站长资讯
OpenAI对ChatGPT、API生成的图片，嵌入C2PA元数据
2月7日凌晨，OpenAI在社交平台宣布，对ChatGPT和API生成的图片，现在已经嵌入了C2PA的元数据，以防止图片被非法乱用。C2PA是一种开放数据标准，允许出版商、企业、开发者等，通过元数据来跟踪和验证数字内容，例如，图片、视频、文档等，最初来源、真实性和完整性。
站长网2024-02-07 09:00:33
0000
站长资讯
虹软科技推出PhotoStudio® AI 几秒生成高清商拍大片
要点:虹软科技推出了一款面向电商的创新产品——PhotoStudio®AI智能商拍摄影云工作室，可以实现在线的商品图生成和编辑，提高商拍效率和质量。PhotoStudio®AI智能商拍摄影云工作室基于虹软ArcMuse计算技术引擎，融合了虹软视觉大模型、小模型和各类CV和CG引擎包，具有强大的创造力和灵活性。
站长网2023-10-24 22:26:32
0000
站长资讯
百度、腾讯、阿里等企业向英伟达订购50亿美元AI芯片
据英国金融时报消息，百度、腾讯、阿里巴巴和字节跳动四家公司合计向英伟达订购了价值50亿美元的AI芯片。其中，今年英伟达将发货约10万块A800芯片，价值10亿美元，另外价值40亿美元的芯片将在明年交付。
站长网2023-08-10 09:44:09
0000
站长资讯
又一家企业走上了直播自救的老路！
在流量时代，任何一个契机，都有可能让声势减弱的品牌和企业“起死回生”，而直播间，就是那个最大的翻红地。这两年，有许多直播间因种种契机被流量砸中，成百上千万的观众涌入直播间，让直播间一夜爆火，带来成倍的销量增长。最近，受到京津冀暴雨影响，主营库存书业务的电商平台中图网损失惨重，400万册图书、价值超过3亿元，一夜之间化为乌有。
站长网2023-08-11 12:15:23
0000
站长资讯
英伟达发布最强AI加速卡大语言模型性能比H100提升30倍
英伟达在GTC开发者大会上发布了最强AI加速卡BlackwellGB200，计划今年晚些时候发货。GB200采用新一代AI图形处理器架构Blackwell，其AI性能可达20petaflops，比之前的H100提升了5倍。每个BlackwellDie的浮点运算能力比HopperDie高出25%，每个封装中有两个Blackwell芯片，总性能提高了2.5倍。
站长网2024-03-19 11:58:27
0000