用钙钛矿取代硅研制电子器件,居然还能被用来完成 AI 计算???众所周知,钙钛矿作为一种重要的材料,掺杂后主要用于生产 SCI 及博士论文(手动狗头)。这次被用在开发新型 AI 电子器件上,还登上了 Science,结果让人眼前一亮:其心律识别任务的平均性能是传统硬件的 5.1 倍,并且还能灵活模拟动态网络、降低训练能耗。
用神经形态计算降能耗
这项研究主要是通过向钙钛矿中掺入不同量的氢,来模拟人类神经元活动,从而完成不同机器学习任务。这主要是基于钙钛矿自身的特性。钙钛矿具备独特的晶体结构,很容易吸收氢离子。氢离子的加入可以改变材料的导电性,由此也就可以让材料制备成一种可切换状态的 AI 电子器件。
在这里研究人员使用了一种混合了钕和镍的钙钛矿材料。通过向这一材料中混合不同含量的氢离子,来改变元件的不同状态,以此实现对大脑神经元活动的模拟。
具体来看,在这种材料中加入大量氢离子后,它的电子最终会转移到镍原子上,导致原子电性发生改变,进而影响材料的导电性。这时,施加外部电场可以控制氢的电子转移;再控制氢的含量,则可以让该电子元件在 4 种不同模式之间切换。这 4 种模式分别是神经元模式、突触模式、电阻器模式和记忆电容器模式。
其中,在不掺杂或少量掺杂氢离子的情况下,该材料处于电阻器模式,可以用来存储和处理信息。在经过一个电子脉冲刺激后,该硬件可切换到记忆电容器模式。记忆电容器是模仿大脑结构神经网络系统的常见元件。神经元模式会积累多个信号,此时元件电阻会发生明显变化,可以模拟人类大脑神经元被刺激时的活动状态。突触模式则是根据神经元信号的强度来转换输入。
之所以会想到向钙钛矿这种材料中掺入氢,是因为研究人员想要利用神经拟态计算来构建这一新器件。这是一种不同于普通冯・诺依曼计算体系的结构,它主要通过模拟人脑神经元和突触的活动来完成机器学习任务。它最大的好处就是可以降低计算能耗,这对于解决未来更复杂、更大规模的 AI 计算具有重大意义。由此一来,在进行 AI 计算时,便无需在硬件上激活、关闭不同的部分,只需控制硬件调整到相应模式即可。研究人员还表示,这种电子器件的内部是亚稳定状态,可以保持 6 个月不用替换氢离子。
实验结果
那么,这种硬件在不同神经网络中的表现如何?就成为了验证其性能的关键。在这里,研究人员使用了两个神经网络作为测试。
第一个是一种储层计算网络,这是一种模拟人类大脑运作方式的机器学习系统。它的运作过程是将信息输入到一个储层,其中的数据以各种方式连接在一起,然后这些数据再被送出储层进行分析。由此一来,该网络也就无需预训练大量数据,仅对输出前的最后一层网络做梯度下降即可。其中的关键储层,将分别用此次提出的新电子器件和传统硬件来完成运算。
与传统理论储层和实验储层相比,这种新型储层(H-NNO)在 MINIST(手写数字识别)、SpokenDight(音频数字识别)、ECGHeartBeat(心率识别)三个任务上都能使用更少的设备、实现相同的性能。平均性能则分别高出 1.4 倍、1.2 倍和 5.1 倍。
此外,基于这一新型电子器件设计的动态神经网络,在处理增量学习上的表现也非常好。如下网络(GWR)是一个可以识别红鸟、黄鸟的系统。理想状态下,当网络检测到新类型(蓝鸟)的输入时,系统会通过增加节点的方式来扩大网络规模。
如果其中任何一类动物长时间没有出现在输入中,其对应的节点也会随之关闭,以此来节省能耗。
研究人员继续使用了手写数字识别这一数据集来进行测试。首先,他们让网络识别 0-4 范围内的数字。然后将范围扩大到 0-9 训练一段时间,之后再只识别 0-4。结果显示,随着后来 5-9 的数字不再出现,网络中的相关节点也在逐渐关闭。下图 i-iii 中,数字表示对应打开节点,黑色区域则表示关闭的节点。
再将这一动态神经网络与静态网络对比,研究人员发现在增量学习场景下,对于 MNIST、CUB-200 两个数据集,动态网络的表现都更好。从如下图 B-E 中可以看到,在 MINIST 数据集测试中,动态网络最终准确性是静态网络的 2.1 倍;数据集 CUB-200 的最终准确性则是静态网路的 2.5 倍。
北航张海天教授为共同一作及通讯作者
北京航空航天大学张海天教授为该论文的共同一作及通讯作者。
他博士毕业于美国宾夕法尼亚州立大学材料科学与工程专业。2018 年获得美国吉尔布雷斯学者基金(Gilbreth Research Fellow),于普渡大学工程院开展独立研究工作(合作教授:Shriram Ramanathan 以及 Kaushik Roy)。去年 9 月,张海天全职加入北京航空航天大学材料科学与工程学院。主要研究领域为功能相变材料的调控及神经计算学器件应用、磁性功能材料、纳米材料等。
论文链接:
https://www.science.org/doi/10.1126/science.abj7943
参考链接:
https://arstechnica.com/science/2022/02/hydrogen-soaked-crystal-lets-neural-networks-expand-to-match-a-problem/