MIT等机构推出数据溯源平台解决AI领域的数据透明危机

站长网2023-10-26 10:45:160阅

🔍 划重点:

1. 研究人员联合MIT、Cohere for AI等机构发布了Data Provenance Platform，旨在解决AI领域的数据透明危机。

2. 他们对近2，000个广泛使用的微调数据集进行了审计和追踪，这些数据集已被下载数千万次，是许多自然语言处理（NLP）突破的基础。

3. 报告指出，数据集的溯源和透明度问题可能导致数据泄漏、暴露个人身份信息、出现意外偏见或行为，从而降低了模型的质量，同时也带来了法律和伦理风险。

研究人员来自麻省理工学院（MIT）、Cohere for AI以及其他11个机构，他们共同发布了Data Provenance Platform，旨在应对AI领域的数据透明危机。这一平台的推出旨在解决AI模型训练数据集的来源和使用透明度不足的问题，这是当前AI领域亟待解决的挑战之一。

图源备注：图片由AI生成，图片授权服务商Midjourney

这个跨机构合作的倡议审计和追踪了近2，000个广泛使用的微调数据集。这些数据集被下载了数千万次，被认为是许多自然语言处理（NLP）领域突破的基础。这一举措的发起者包括MIT Media Lab的博士候选人Shayne Longpre和Cohere for AI的负责人Sara Hooker。

这个跨学科倡议的结果是迄今为止规模最大的AI数据集审计。这些数据集首次包含了标签，用于指示原始数据来源、多次重新授权、创建者和其他数据属性。为了使这些信息实际可操作并易于获取，他们还开发了一个名为"Data Provenance Explorer"的互动平台，允许开发人员根据法律和伦理考虑来跟踪和筛选成千上万个数据集，同时也让学者和记者探索流行AI数据集的组成和数据渊源。

与此同时，他们还发布了一份名为"The Data Provenance Initiative: A Large Scale Audit of Dataset Licensing & Attribution in AI"（数据来源倡议:人工智能中数据集许可和归属的大规模审计）的研究报告。报告指出，越来越多的广泛使用的数据集被视为单一整体，而不是一系列数据来源，这些数据经过多次包装和重新授权。这种处理方式的缺点在于，它们通常不充分注明数据来源和版权信息，这导致了对训练数据的理解不足。这一不足可能导致训练数据和测试数据之间的数据泄漏，暴露个人身份信息，导致意外的偏见或行为，最终降低了模型的质量。此外，这也带来了伦理和法律风险，例如，模型发布与数据使用条款可能相互抵触。这些挑战都不容易解决，因为在数据上训练模型既昂贵又基本不可逆转。

Data Provenance Platform的推出有望改善AI领域的数据透明度，提高数据集的质量和伦理合规性，从而推动AI技术的可持续发展。这一举措也将有助于减少AI模型中的潜在问题，如偏见、数据泄漏和法律风险，为AI技术的广泛应用提供更可靠的基础。

MIT等机构推出数据溯源平台解决AI领域的数据透明危机

0000

评论列表

共(0)条

相关推荐

站长资讯
挑战用利息生活，这届年轻人的平静疯感
最近，各大社交平台开始流行起利息生活挑战，他们有的小有积蓄的在校大学生，有的是余额几万元的裸辞打工人，还有的是存款几十万甚至百万的资深职场人。用利息当日常开支后，他们的生活状态是怎样的?在逃离工作职场后，他们能否提前过上“退休”生活?用利息生活的状态是怎样的?抖音博主@小宇.是一名在校大学生，凭借用利息生活挑战系列视频，他已经收获了3.4万粉丝。
站长网2024-08-05 16:37:29
0000
重磅！微软开源最强小模型Phi-4，超GPT-4o、可商用
今天凌晨，微软研究院开源了目前最强小参数模型——phi-4。去年12月12日，微软首次展示了phi-4，参数只有140亿性能却极强，在GPQA研究生水平、MATH数学基准测试中，超过了OpenAI的GPT-4o，也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。
站长网站长资讯2025-01-09 09:17:42
0000
站长资讯
余承东把问界M9送到360楼下周鸿祎：非常感动永远支持华为
近日，360创始人周鸿祎公开表示有意出售自己的迈巴赫600，计划换购国产新能源汽车。此消息一出，立即引起了众多国内新能源车厂商的关注。蔚来、小鹏、极氪、理想等知名品牌纷纷将自家主流车型送至360公司总部，供周鸿祎亲自体验。这一景象也吸引了众多网友前来直播打卡，使得360公司楼下俨然成为了一个小型车展，被网友们戏称为“798小车展”。
站长网2024-04-26 10:24:37
0001
站长资讯
抖音：即日起抖音VR直播在苹果Vision Pro支持下载体验
今日，抖音集团在微信公众号上宣布，其最新推出的抖音VR直播功能现已在AppleVisionPro平台上线，供用户下载体验。这项技术革新带来了全新的观看体验:通过小范围6DoF技术，观众的视线所及之处，内容都能实时追随，无论从哪个角度观看，都能享受到超清的正面视角。3D直播技术让画面突破传统屏幕限制，与现实世界无缝融合，为用户带来前所未有的立体观看体验。
站长网2024-07-11 08:54:22
0000