基于 Transformer 的大模型如何从参数中提取知识
站长网2023-07-26 15:01:190阅
最近一项由 Google DeepMind、特拉维夫大学和 Google 研究人员进行的研究,旨在探究基于 Transformer 的大型语言模型(LLMs)如何存储和提取事实关联。研究采用信息流的方法,研究模型如何预测正确的属性,并观察模型在不同层次中的内部表示是如何演变的。
论文地址:https://arxiv.org/abs/2304.14767
研究发现,模型的关键计算点与关系和主体位置有关。研究人员使用 "阻塞" 策略,阻止最后一个位置在特定层次上与其他位置产生关联,并观察推理过程中的影响。通过分析这些关键点和前面的表示构建过程,研究人员进一步确定了属性提取发生的位置。
研究人员发现了一种基于主体丰富过程和属性提取操作的内部机制。在模型的早期层次中,关于主体的信息在最后一个主体标记中得到丰富,而关系则传递给最后一个标记。最后一个标记使用关系通过自注意力机制从主体表示中提取相应的属性。
这些发现揭示了 LLMs 内部如何存储和提取事实关联的机制。研究人员认为,这些发现可以为知识定位和模型编辑开辟新的研究方向。例如,可以利用这种方法来确定 LLMs 获取和存储偏见信息的内部机制,并开发缓解这种偏见的方法。
总之,这项研究强调了研究 Transformer 模型如何存储和提取事实关联的内部机制的重要性。通过了解这些机制,研究人员可以开发更有效的方法来提高模型性能并减少偏见。此外,这种方法还可以应用于其他自然语言处理领域,如情感分析和语言翻译,以更好地理解这些模型的内部运作。
0000
评论列表
共(0)条相关推荐
澳大利亚警方运用AI分析数据 识别洗钱和诈骗活动
文章概要:1.澳大利亚联邦警察(AFP)开始使用人工智能分析监视许可数据,以帮助识别洗钱和潜在欺诈活动。2.AFP在提交给政府的文件中表示,他们的人工智能技术使用迄今有限,但有望改善警务工作的效率。3.不过其他组织存在对人工智能使用的担忧,包括大型语言模型的使用和对数据的透明性要求。站长网2023-09-22 11:00:14000020万元买特斯拉?陶琳甩出5张图:中国价格全球最低
快科技4月14日消息,特斯拉最近开始在全球多个国家开启新一轮降价,美国、欧洲等地区已经降价,最多可达1万欧元,这也引发了国内网友的猜测,如果再降价,20万元买特斯拉就不远了。然而国内降价的消息一直没有证实,今晚特斯拉对外事务副总裁陶琳直接甩出了5张图,没有正面回应是否降价,但用意很明显了。站长网2023-04-15 09:33:210000OpenAI透明度承诺放缓,拒绝向公众开放内部文件
自成立以来,OpenAI作为人工智能初创公司,一直以公开透明的原则为特征,并承诺向公众开放其内部文件。然而,最近的人事变动引发了一系列变化,OpenAI的透明度似乎在下降。《连线》杂志曾要求获取这些文件,却遭到了出人意料的拒绝。站长网2024-01-25 09:48:530000小红书急需新“顶流”
“小红书不是电商,而是一个游乐场”,小红书创始人瞿芳曾经这样定义小红书。在瞿芳看来,小红书的用户不是为了买东西而来,小红书的本质运营逻辑是建立内容社区,电商不过是竖向变现的方式,二者难以相提并论。站长网2023-07-26 12:02:020001镁除了烧,还能拿来干嘛?
镁(Mg)是宇宙中第九丰富的元素,它生成于巨大的老年恒星内部,由三个氦原子核相继加入一个碳原子核形成新的镁核。当像超新星这样的恒星爆炸时,大部分的镁被散射到星际介质中,在那里镁可以循环进入新的恒星系统。站长网2023-05-24 12:00:410000