登陆注册
11494

IBM 的类脑芯片可能是迄今为止运行人工智能速度最快的芯片

站长网2023-10-20 11:17:380

站长之家(ChinaZ.com) 10月20日消息:位于加利福尼亚州圣何塞的 IBM 研究人员开发了一款脑启发式计算芯片,该芯片可以通过更快速和更低功耗的工作方式,加速人工智能(AI)的发展

他们的大规模 NorthPole 处理器芯片消除了频繁访问外部内存的需求,因此可以比现有架构执行图像识别等任务更快,同时消耗大大少于电能。

巴黎萨克雷大学帕莱索分校的纳米电子研究员 Damien Querlioz 表示:「它的能效令人叹为观止。」该项工作发表在《Science》杂志上,显示了计算和内存可以大规模集成,他表示:「我认为这篇论文将撼动计算机架构的共识。」

NorthPole 运行神经网络:多层次的简单计算单元数组,编程用于识别数据中的模式。底层接收数据,例如图像中的像素;每个后续层检测日益复杂的模式,并将信息传递给下一层。顶层生成输出,例如可以表示图像中是否包含猫、汽车或其他物体的可能性。

尽管某些计算机芯片可以有效处理这些计算,但它们在每次计算一个层次时仍需要使用称为 RAM 的外部内存。通过这种方式在芯片之间传输数据会减慢速度,这被称为冯·诺依曼瓶颈,以数学家约翰·冯·诺依曼的名字命名,他首次构思了基于处理单元和单独内存单元的标准计算机架构。

冯·诺依曼瓶颈是减慢计算应用(包括 AI)的最重要因素之一。它还导致能源效率低下。研究合著者、IBM 的计算机工程师达 Dharmendra Modha 表示,他曾经估计,在这种类型的架构上模拟人脑可能需要相当于 12 座核反应堆的输出。

NorthPole 由 256 个计算单元或核心组成,每个核心都包含自己的内存。位于 IBM 圣何塞阿尔马登研究中心的 IBM 脑启发式计算首席科学家 Modha 表示:「你正在核心内减轻冯·诺依曼瓶颈的影响。」

这些核心被连接成一个网络,灵感来自于人类大脑皮层各部分之间的白质连接。这和其他设计原则——大多数原则在此之前已经存在,但从未被结合在一个芯片上——使 NorthPole 在图像识别的标准基准测试中大大超越了现有的 AI 机器。尽管它没有使用最新和最微型化的制造过程,但它仍然比最先进的 AI 芯片的能耗低了五分之一。作者估计,如果采用最新的制造工艺来实现 NorthPole 设计,其效率将比当前设计高 25 倍。

但是,即使 NorthPole 的 224 兆字节 RAM 也不足以运行大型语言模型,比如聊天机器人 ChatGPT,即使在最精简的版本中,这些模型也需要几千兆字节的数据。此外,该芯片只能运行需要在分开的机器上预先进行「训练」的预编程神经网络。但论文的作者表示,NorthPole 架构在速度关键的应用中可能会非常有用,如自动驾驶汽车。

NorthPole 将内存单元尽可能靠近核心中的计算元素。在其他地方,研究人员正在使用新材料和制造工艺开发更激进的创新。这些使内存单元本身能够执行计算,从原理上可以进一步提高速度和效率。

0000
评论列表
共(0)条