可验证大模型输出、训练来源，斯坦福提出“统一归因”框架

站长网2023-12-21 14:07:070阅

随着ChatGPT等大模型被广泛应用在实际业务中，其输出内容的真实、可靠、安全性成为了重点。学术界则使用“归因”来表示追查、证实内容。

目前，在“归因”研究领域有两大派系，一种是协同归因，主要追查引用数据和训练数据来源;另外一种是贡献归因，证明模型输出内容的真实性以减少幻觉。

这两种归因方法对于法律、医疗、金融等，对于内容准确率要求极高的行业应用大模型至关重要。

但是这两种研究方法是分开独立进行的，所以，斯坦福大学的研究人员提出了“统一归因”框架，将两种方法集成在一起。

论文地址:https://arxiv.org/abs/2311.12233

协同归因

协同归因主要是用来验证大模型的输出是否正确，并与外部的知识进行比较。例如，我们可以通过生成一些相关的引文或参考文献来追溯大模型输出的来源，并验证它的准确性。

同时可以通过从外部的知识库中检索相关的知识，然后与大模型的输出进行对比和验证。具体功能如下:

引文生成验证:该功能是生成与大模型输出相关的引文或参考文献。它会在知识库或文献数据库中搜索相关的文献，并根据大模型输出的内容生成相应的引文，以追溯大模型输出的来源，并验证其准确性。

例如，通过自然语言处理技术和信息检索技术，验证关键词匹配、文本摘要生成等。

知识检索验证:该功能是从外部的知识库中检索与大模型输出相关的知识，可以利用知识图谱、在线百科全书或专业数据库等资源，通过关键词匹配或语义相似度计算来检索相关的知识。

然后，将检索到的知识与大模型的输出进行对比和验证，以确定其准确性和一致性。

事实验证:可以通过对外部数据源或可信的事实数据库进行查询来实现，通常利用自然语言处理技术和数据匹配算法，将大模型的输出与事实进行比对，从而判断其准确性和可信度。

贡献归因

贡献归因方法主要是用来确定训练数据对大模型输出的影响有多大。例如，我们可以对训练数据进行微小的变动，然后观察大模型输出的变化，从而计算出每个训练样本对大模型输出的影响程度。

另外，可以生成一些模拟的数据，并比较它们与真实数据集上大模型输出的差异，这样就可以推断出训练数据的贡献程度。具体功能如下:

影响函数验证:通过对训练数据进行微小的变动，观察大模型输出的变化来实现。

开发者可以设计一些影响函数来度量变动对大模型输出的影响程度，就可以确定哪些训练数据对大模型输出具有重要影响，从而更好地理解模型的行为。

数据模拟器验证:通过生成一些与真实数据相似但有差异的数据，可以观察大模型输出的差异，从而推断出真实数据对大模型输出的贡献程度。

数据模拟器验证可以利用生成对抗网络（GAN）或其他生成模型来生成模拟数据。

数据模型验证:通过构建一个数据模型，用于表示大模型对训练数据的学习和预测过程。数据模型可以是一个统计模型或神经网络模型。

通过分析数据模型，开发者们可以确定哪些训练数据对大模型输出具有重要性，并对模型的训练和优化过程进行解释。

斯坦福便是将协同归因和贡献归因的主要功能，整合在一个框架中方便开发者对大模型进行各种安全、内容验证。

可验证大模型输出训练来源斯坦福提出统一归因框架

0000

评论列表

共(0)条

相关推荐

站长资讯
半托管、平台化，跨境电商硝烟再起
"ShopLikeaBillionaire!"（像亿万富翁一样购物）Temu今年再次豪掷千万美元登上NFL（美式橄榄球联盟）超级碗联赛，连续6次植入30s广告。伴随着轻快的音乐，动画主人公载歌载舞，印着Temu小箱子如有魔法，不仅帮人换新衣，还把世界染成Temu标志性的橙色。令美国观众感叹:“到底要在超级碗看多少次Temu广告!”
站长网2024-02-21 17:48:37
0000
站长资讯
金山办公宣布将推出 WPS AI：对标微软 Microsoft 365 Copilot
WPS办公助手官方微信公众号发布文章宣布，新版WPS会员体系正式上线。除此之外，WPS官方在文末表示，即将推出「WPSAI」。据WPS办公助手官方介绍，「WPSAI」即全面嵌入AI能力的WPS超级会员。目前，暂未有更多「WPSAI」相关信息公布。
站长网2023-04-17 11:49:14
0000
ChatGPT终于发布长期记忆功能，开启个人Agent时代
今天凌晨1点，OpenAI对ChatGPT功能进行了大更新，新增长期记忆功能，可以记住你过去所有的聊天记录，会根据你的兴趣、偏好提供更个性化的回答。这对于写小说、金融分析、教育等领域帮助巨大。如果你不喜欢这个功能，也可以随时关闭。例如，你之前和ChatGPT聊天时，多次询问了关于科幻小说的写作技巧，还提到自己喜欢硬科幻风格以及喜欢阿西莫夫的作品。
站长网站长资讯2025-04-11 09:01:42
0000
站长资讯
10年烧掉47亿，欧盟「人脑计划」宣告失败？算法重建人类大脑遥不可及，成果支离破碎
【新智元导读】十年，欧盟的人脑计划即将到期，然而烧光47亿后，成果依然支离破碎，重建人类大脑的雄伟计划似乎仍然遥不可及。十年前，欧洲的科学家们计划在巨型计算机中重建人脑。十年后，欧盟的6亿欧元多半是打了水漂。在这个叫做HumanBrainProject（简称HBP）的计划里，欧盟投入了将近47亿人民币。有超过500名顶尖科学家，发表了数千篇论文。
站长网2023-08-24 11:44:03
0000
站长资讯
智谱AI推出第三代基座大模型ChatGLM3 智谱清言具备代码交互能力
智谱AI在2023中国计算机大会上发布了第三代基座大模型ChatGLM3及相关系列产品。ChatGLM3经过深度优化，在中英文公开数据集测试中表现优秀，其中MML提升36、CEval提%、GSM8K提升179%、BBH提升126%。ChatGLM3实现了多模态理解能力、代码生成和执行、网络搜索增强等新功能，并通过自研的AgentTuning技术提升了智能规划和执行能力。
站长网2023-10-28 07:49:28
0000