OpenAI开发新工具,试图解释大语言模型的行为
在很多人看来,与OpenAI 的 ChatGPT类似的大型语言模型 (LLM)就像一个黑匣子,因为即使对于数据科学家来说,也很难知道为什么这些模型总是以自己的方式做出反应,就像凭空捏造事实一样。
为了能够剖析 LLM 的的行为,OpenAI 正在开发一种工具来自动识别 LLM 的哪些部分对其行为负责。简单的说,OpenAI在最新的发布成果中,展示了用 GPT-4解释 GPT-2的行为,获得了初步的成果。
OpenAI开发的工具通过调用 GPT-4来计算出其他架构更简单的语言模型上神经元的行为。该工具会为 LLM 中的每个神经元生成解释,这些解释被编译到与工具代码一起发布的数据集中。

大模型(LLM)和人脑一样,由「神经元」组成,这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。
比如有一个针对「漫威超级英雄」的神经元,当用户向模型提问「哪个超级英雄的能力最强」时,这个神经元就会提高模型在回答中说出漫威英雄的概率。开始之前,先让 GPT-2运行文本序列,等待某个特定神经元被频繁「激活」的情况。
OpenAI 开发的工具利用这种规则将模型进行分解。
首先,让 GPT-4针对这段文本,生成解释。比如在下面的案例中,神经元主要针对漫威内容。GPT-4接收到文本和激活情况后,判断这与电影、角色和娱乐有关。接着,用 GPT-4模拟这个 GPT-2的神经元接下来会做什么,并用GPT-4生成的模拟内容。最后,进行对比评估。对比4代模拟神经元和2代真实神经元的结果,看 GPT-4猜的有多准。为了确定解释的准确性,该工具为 GPT-4提供了文本序列,并让它预测或模拟神经元的行为方式。然后将模拟神经元的行为与实际神经元的行为进行比较。

通过这样的方法,OpenAI 对每个神经元的行为作出了初步的自然语言解释,并对这种解释和实际行为的匹配程度进行了评分。
研究人员已经对 GPT-2中的所有307,200个神经元生成解释,并将这些解释汇编成数据集,与工具代码一起在 GitHub 上发布。

它背后的工程师强调它还处于早期阶段,但其运行代码已经可以在 GitHub 上以开源方式获得。OpenAI 的工具可以帮助研究人员更好地理解 LLM 的行为,从而提高性能并减少偏差或毒性。
也有人质疑,该工具本质上是为 GPT-4做广告,因为它需要 GPT-4才能工作。其他解释 LLM 工具较少依赖商业 API,例如 DeepMind 的Tracr。
谷歌斥资20亿美元战略投资AI初创公司Anthropic
划重点:1.谷歌宣布向Anthropic投资20亿美元,进一步巩固其在快速发展的人工智能领域的地位,引发行业动态深刻转变。2.谷歌的投资不仅仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时巩固GoogleCloud在尖端AI研究和部署的地位。3.亚马逊也对Anthropic进行重大投资,进一步证明其潜力,并将其置于高风险的技术竞争中。站长网2023-10-30 10:09:060000OpenAI提交GPT-5商标申请 此前称目前没有训练GPT-5计划
ChatGPT的开发者OpenAI已经向美国专利商标局(USPTO)提交了“GPT-5”的商标申请。这一消息是由商标律师JoshGerben在推特上分享的。尽管OpenAI尚未正式确认GPT-5的具体功能和改进,但该商标申请表明了该语言模型或有新版本。GPT-5被推测是OpenAI高级语言模型的下一个迭代,可能会代表自然语言处理和人工智能能力的方面的重大进步。站长网2023-08-01 09:11:440000谷歌推王炸级图像生成功能Generative Powers of Ten 生成图像可无限放大
Google最近发布了一项名为“GenerativePowersofTen”的图像生成功能,这项功能支持对生成的图像进行无限放大。这意味着用户可以将一张人像照片放大到可以看到细胞结构,或者将地球大气层缩放到地面上的物体。站长网2023-12-08 11:53:370002LG与联合国教科文组织合作推动人工智能伦理
**划重点:**1.🌐LGAIResearch与联合国教科文组织在首尔签署了合作意向书,旨在共同促进人工智能伦理的知识和认识。2.🎓合作将通过大规模在线课程和人工智能伦理教材加强公共和私营部门的能力。3.🤖协议重点推动既有助于人类又有助于可持续发展的人工智能技术,包括实施人工智能伦理影响评估和制定有效的治理模型以确保数据隐私和安全。0000未成年人网络保护拟出台行政法规:为网络沉迷防治立规矩
据司法部官微消息,近日,司法部、国家网信办专题研究审议《未成年人网络保护条例(草案)》,进一步修改完善后,将加快推动条例立法进程。站长网2023-07-12 12:11:310000