OpenAI开发新工具，试图解释大语言模型的行为

站长网2023-05-10 10:32:210阅

在很多人看来，与OpenAI 的 ChatGPT类似的大型语言模型（LLM）就像一个黑匣子，因为即使对于数据科学家来说，也很难知道为什么这些模型总是以自己的方式做出反应，就像凭空捏造事实一样。

为了能够剖析 LLM 的的行为，OpenAI 正在开发一种工具来自动识别 LLM 的哪些部分对其行为负责。简单的说，OpenAI在最新的发布成果中，展示了用 GPT-4解释 GPT-2的行为，获得了初步的成果。

OpenAI开发的工具通过调用 GPT-4来计算出其他架构更简单的语言模型上神经元的行为。该工具会为 LLM 中的每个神经元生成解释，这些解释被编译到与工具代码一起发布的数据集中。

大模型（LLM）和人脑一样，由「神经元」组成，这些神经元会观察文本中的特定规律，进而影响到模型本身生产的文本。

比如有一个针对「漫威超级英雄」的神经元，当用户向模型提问「哪个超级英雄的能力最强」时，这个神经元就会提高模型在回答中说出漫威英雄的概率。开始之前，先让 GPT-2运行文本序列，等待某个特定神经元被频繁「激活」的情况。

OpenAI 开发的工具利用这种规则将模型进行分解。

首先，让 GPT-4针对这段文本，生成解释。比如在下面的案例中，神经元主要针对漫威内容。GPT-4接收到文本和激活情况后，判断这与电影、角色和娱乐有关。接着，用 GPT-4模拟这个 GPT-2的神经元接下来会做什么，并用GPT-4生成的模拟内容。最后，进行对比评估。对比4代模拟神经元和2代真实神经元的结果，看 GPT-4猜的有多准。为了确定解释的准确性，该工具为 GPT-4提供了文本序列，并让它预测或模拟神经元的行为方式。然后将模拟神经元的行为与实际神经元的行为进行比较。

通过这样的方法，OpenAI 对每个神经元的行为作出了初步的自然语言解释，并对这种解释和实际行为的匹配程度进行了评分。

研究人员已经对 GPT-2中的所有307，200个神经元生成解释，并将这些解释汇编成数据集，与工具代码一起在 GitHub 上发布。

它背后的工程师强调它还处于早期阶段，但其运行代码已经可以在 GitHub 上以开源方式获得。OpenAI 的工具可以帮助研究人员更好地理解 LLM 的行为，从而提高性能并减少偏差或毒性。

也有人质疑，该工具本质上是为 GPT-4做广告，因为它需要 GPT-4才能工作。其他解释 LLM 工具较少依赖商业 API，例如 DeepMind 的Tracr。

OpenAI开发新工具试图解释大语言模型的行为

0000

评论列表

共(0)条

相关推荐

微软应用商店用上AI：上千条用户评价一句话看完
快科技7月25日消息，作为OpenAI背后最大的股东之一，微软毫不吝啬在自家的应用上加入AI作为辅助。现在，微软开始尝试在应用商店中，加入AI相关功能。目前，美国地区的微软应用商店已经支持通过AI，在几秒钟内将一个应用的数千条在线评论总结成一段精炼的文字，突出显示最重要的观点。对于用户来说，这将大大提升选择与下载应用时，收集参考建议的效率。
站长网站长资讯2023-07-26 09:59:22
0000
站长资讯
闯入美榜Top100，昔日网文王者的短剧APP终于还是杀出来了？
不久前，一款名为DreameShort的产品闯入美国iOS畅销总榜Top100，刷新近30天在美榜的最高排名。6月20日，DreameShort来到美国iOS畅销总榜Top100
站长网2024-07-04 09:21:13
0000
比尔·盖茨预测人工智能将引发技术爆炸
**划重点:**1.🌐"人工智能将以前所未见的速度加速新发现"—盖茨在年度展望信说道。2.💡在未来18至24个月内，盖茨预测美国等发达国家普通民众将开始广泛使用人工智能，对生产力和创新产生巨大影响。3.🌍盖茨重点关注人工智能在发展中国家的应用，特别强调在全球卫生领域的平等性。
站长网站长资讯2023-12-28 11:39:24
0000
联名兰博基尼！Redmi K70 Pro冠军版明晚开售
站长之家(ChinaZ.com)12月20日消息:RedmiK70Pro冠军版将于明晚7点直播开售。官方还透露，将有一位神秘嘉宾到场，进行一场硬核手机开箱的跨界挑战。值得注意的是，小米集团卢伟冰曾在发布会上透露，RedmiK70Pro冠军版是限量机型，喜欢这款产品的朋友千万不要错过明晚的抢购机会。
站长网站长资讯2023-12-20 11:21:01
0000
站长资讯
德国将对OpenAI的ChatGPT数据使用情况展开调查
继意大利，德国数据保护机构现在也正在加强对ChatGPT的监管，德国联邦州数据保护专员们同启动了相应的行政程序。德国AI工作组负责人迪特·库格尔曼表示，“如果使用个人数据，包括作为AI的训练数据，必须有法律依据，我们必须知道数据来自何处。”
站长网2023-04-21 11:55:54
0000