为了寻求更加快速、高效的计算,研究人员与制造商正忙于探索新颖的处理架构。其中,神经形态计算这一在计算机芯片中模仿大脑运作的方法在深度学习应用的推进中尤为突出,具有巨大潜能。深度学习是一种日益普遍的人工智能(AI)形式,其利用受大脑启发的神经网络以揭示大型数据集中的规律。

在使用常规计算机硬件的传统机器学习中,内存和处理节点的位置是分开的。相反,神经形态计算机硬件模拟了神经元,并将这两个功能放在同一位置。该架构无需在处理站点和存储站点之间来回传输数据,因而可以大大降低某些特定学习任务(如图像识别和分类)的计算时间和功耗需求。

虽然神经形态计算的概念起源于20世纪80年代末期,但是由于算法开发的速度缓慢,构建一体的内存/ 处理节点需要新型材料,以及在扩大规模方面存在挑战,神经形态计算的发展受到了阻碍。美国纽约州伊萨卡市康奈尔大学的心理学教授Thomas Cleland表示,早期的神经形态神经网络没有可塑性。一旦设置完毕,就只能训练它们完成一项特定的任务。要想完成其他的任务,就需要对其进行重建和重新训练。Cleland说道,这种限制具有“非常大的局限性”。

现在,技术进步已经在很大程度上打破了这一限制。“在过去的10年中,人工智能最重要的进步之一就是提出了更快更好的学习方法,”美国马萨诸塞州剑桥市哈佛大学医学院的眼科学教授兼大脑、思维和机器中心副主任Gabriel Kreiman说道,“直接赋予硬件可塑性,可以让人们不用从头开始就可以重新训练机器,这是具有相当变革意义的。”

神经形态计算的两种新的应用展示了这种设计的潜力,即以极快的速度和最小的功耗有效解决各种各样的问题:一种应用是电子鼻,它仅在接触一次化学物质之后即可识别该物质的气味[1];另一种应用是具有图像传感器的机器视觉设备,它可以兼作一种人工神经网络,并且处理图像的速度比传统技术快数千倍[2,3]。

电子鼻是由Cleland和Nabil Imam共同构建的一种“一次性学习”(one-shot learning)嗅觉系统。Nabil Imam是美国加利福尼亚州圣克拉拉市英特尔神经形态计算实验室的一位工程师。该系统运用了英特尔第五代神经形态芯片(图1 [1])Loihi,其中包含128个中央处理器,每个中央处理器都配有内置的学习模块和超过13万个的计算神经元,而且每个神经元都与周围的数千个神经元相连[4]

《图1》

图1. 美国康奈尔大学和英特尔公司的研究人员开发的一种电子鼻,该电子鼻仅在接触一次用于神经形态计算的英特尔第五代研究芯片 Loihi上释放的化学物质,即可识别该化学物质的气味[1]。如图所示,该芯片将内存和处理节点放置在各个模块中,从而能够高效检测气味和其他有规律的刺激[4]。图片来源:Tim Herman/Intel Corporation。

Cleland和Imam为了评估该系统,将电子鼻与传统的神经网络进行比较,让两者检测通过风洞吹出的10种气味,其中风洞中装有72个金属氧化物气体传感器(数据来源于公开的数据集[5])。神经形态系统的训练只需在每种气味下暴露一次,而传统的人工智能的训练则需要暴露数百次。识别出的每种气味仅占测试总气味的 20%~80%,这说明在现实世界中,许多气味通常是混合在一起的。神经形态人工智能对目标气味的识别率为 92%,而传统人工智能的识别率为52% [1]

“我们可以利用纯净的气味训练我们的算法,如使用橙子味或乙酸戊酯味(一种类似香蕉的气味),并在许多不同的环境下辨识这种气味,”Cleland表示,“你可以在面包店、垃圾场或沼泽中测试,它都能识别这种气味。”

标准人工智能的训练不仅耗时、耗能,而且每次添加新气味时都必须从头开始。而神经形态人工智能只需在网络中添加新的神经元便可继续识别新的气味。 Cleland目前想让自动机器人也使用这一系统。“我们希望只花几秒钟时间就能将系统训练完毕,并使其能够准确地识别气味,即使气味被无法控制的污染物掩盖,也不会影响其准确性,”他说,“我们不想说,‘哦,是的,当物品呈酸性,或是太潮湿,或有任何其他情况时,它就不起作用。’”

该系统的潜在应用包括空气质量监测、有毒废物识别、地雷检测、痕量药物检测和医疗诊断。但是,Cleland表示,该算法不只局限于化学感知。他和他的团队利用该算法,从高光谱卫星图像中对地面覆盖物进行了分类,同时识别出南美丛林中的蛙叫声[6]。“只要有足够数量的传感器,我们就可以检测任何东西,”他说,“唯一的前提是,传感器需要足够好到能够检测你想要检测的任何东西。”

Cleland和Imam利用了英特尔公司的Loihi芯片,而维也纳工业大学(TU Wien)的研究人员设计了自己的神经形态芯片,可实现极其快速的图像处理(图2 [2,3])。机器视觉技术通常涉及摄像机逐行扫描图像像素,同时将视频帧转换为数字信号,然后将数据传输至外接计算机进行分析——所有这些步骤都会导致严重的延迟。维也纳工业大学的研究人员试图通过开发一种图像传感器来加速这一过程,该传感器本身起到了一种类似人工神经网络的作用,能够同时获取并分析图像。维也纳工业大学光子学研究所的研究生Lukas Mennel说:“感测与计算相结合这一步的确为图像判读开辟了一个全新的方向。”

《图2》

图2.(a)维也纳工业大学的研究人员开发的图像传感器芯片兼有人工神经网络的作用,其处理图像的速度比常规技术快数千倍[2,3]。(b)人工神经网络将投射到传感器上的无噪图像自动编码为现行代码,然后现行代码被转换为二进制激活代码,并最终由解码器重构为图像[2,3]。训练后,自动编码器可以接受有噪声的输入并重建投射的图像。图片来源:TU Wien,经许可。

新传感器由一个3×3像素阵列组成,每个像素代表一个神经元[2]。每个像素又由三个光电二极管组成,每个光电二极管代表一个突触。每个光电二极管由三个原子厚的二硒化钨制成,这是一种对光具有可调节响应的半导体。这种可调性使光电二极管能够以一种可程控的方式记住光并对光产生响应。

为了测试他们的系统,维也纳工业大学的研究人员使用激光将字母“n”“v”和“z”投射到神经网络图像传感器上[3]。传感器能够以相当于2000万帧每秒(fps)的速度正确处理字母的图像。相比之下,常规的机器视觉技术则是以不超过约1000 fps的速度处理图像。

Mennel表示,传感器的速度仅受电路中电子速度的限制,并且从理论上讲,该系统的运行速度可以比报告中的速度快几个数量级。除了超快速处理,图像传感器在运行时不消耗任何电能,因为感测到的光子本身会提供必要的电流为传感器供电。

维也纳工业大学的图像传感器技术具有多种高速应用,包括在断裂力学中的应用,即确定裂纹从哪个方向传播,以及在颗粒检测中的应用,即确定刚刚经过的是哪种颗粒。Mennel表示,从理论上来说,该系统虽然可以处理诸如引导自动驾驶汽车之类的复杂任务,但它仍需要进一步扩大规模。“所以,很明显,下一步就是要扩大规模,这应该是比较容易的,因为人们现在已经能够构建具有数百万个像素的传感器了。”

基于这些结果,神经形态计算可能会成为数字未来的一个重要组成部分。“当前机器学习方法的能耗非常大,通常是出奇的大,”Kreiman称,“神经形态计算可能会革新人们对于计算的认知方式,从而推动某些目前尚不可行的方法的实现,并且只需要花费较少的成本。”