• 首页
  • 科学成果
  • 基于新兴非易失性存储器件的脑启发计算(四)-张鑫博士

基于新兴非易失性存储器件的脑启发计算(四)-张鑫博士

2021-10-18

基于新兴非易失性存储器件的脑启发计算(四)

图片1.png 

1. 突触器件的器件级特性

1.1 期望特性

(1)权值更新中的非对称性和线性度

权重更新中的线性度是指器件电导与相同编程脉冲数之间的曲线的线性度。理想情况下,这应该是一种线性和对称的关系,用于将算法中的权重直接映射到器件中的电导。然而,现实是,电阻性突触器件在权重更新中普遍存在非线性问题。权重增加过程的轨迹[长期增强(long-term potentiation,LTP)]与权重减少过程的轨迹[长期抑制(long-term depression,LTD)]不同,也导致了非对称性。电导在过程开始时变化迅速,但在过程结束时趋于饱和。图2(a)显示了相同编程脉冲下TaOx/TiO2器件电导的示例[1]。这种非线性/不对称性是不希望有的,因为权重的变化(ΔW) 取决于当前的权重(W),或者换句话说,权重更新具有历史依赖性。最近的研究结果表明,这种非线性/非对称性导致了神经网络的学习精度损失[1][2]。有一些策略可以通过优化编程方案来提高线性度。如图2(b)所示,相同的脉冲对(较大的脉冲接较小的反极性脉冲)可以改善TaOx/TiO2器件的非线性。不同脉冲宽度的非相同脉冲可以进一步改善TaOx/TiO2器件的非线性,如图2(c)所示。然而,从外围电路的角度来看,不同的脉冲生成需要非常重要的设计工作,因为在施加编程脉冲之前需要通过读出当前电导状态来校准幅度或脉冲宽度。这个挑战使得非理想脉冲编程方案在片上实现是不切实际的。值得注意的是,权值更新的非线性/不对称性是在线训练的关键问题,在线训练需要平滑连续的电导调整,而离线训练可以通过写验证技术的迭代编程来掩盖非线性。

图片2.png 

图1 不同脉冲方案下TaOx/TiO2器件的权重更新行为(电导vs脉冲)。具有不同脉冲宽度的不同脉冲可以改善非线性/不对称性,但会使外围电路设计复杂化。图片摘自参考文献[1]。

(2)编程的能量消耗

在生物突触中,每个突触事件的估计能量消耗约为1~10fJ(1f=10-15)。大多数RRAM(阻变存储器)器件的编程能量约为100fJ~10pJ(1p=10-12),而大多数PCM(相变存储器)器件的编程能量可能更高,为10~100 pJ。最根本的挑战是,在固态器件中移动离子/缺陷要比在生物突触的液体环境中移动钙离子困难得多(因此需要付出更多的能量)。在生物突触中,尖峰电压为~ 10mV,离子电流为~ 1nA,尖峰周期为~1ms,因此能量约为10fJ。在电阻性突触器件中,典型的编程电压为~1V,编程电流一般为~10μA。虽然编程速度可以加速到~100ns,但能量仍然是pJ的量级。因此需要进一步的器件工程来通过将编程速度提高到~ns范围来降低能耗,同时保持模拟增量电导调谐能力。

(3)保留和耐力(Retention and Endurance)

在线训练时,权值更新频繁,可以放宽数据保留要求。训练完成后,电阻性突触器件应表现为长期记忆,在最高芯片工作温度(例如 85°C)下,数据保留时间约为 10 年。循环耐力的次数非常依赖于应用,取决于训练过程中需要多少权值更新。对于相对简单的任务(即 MNIST 手写数字识别[3]),具有50个训练历元(将重复)的60000个训练图像给出的最大权重更新可能性为 3´106 次更新。实际上并不是每个循环周期的训练都会更新每个突触,所以~104个循环的耐力对于MNIST数据集的训练就足够了。然而,考虑到更有挑战性的任务,可能需要更高的耐力。需要指出的是,电阻性突触器件中耐力循环的定义是棘手的,因为每次权重更新通常是模拟电导调谐中的一个小的增量变化,因此,它不同于二进制eNVM中从开状态到关状态的完全切换。

(4)一致性和可变性

eNVMs一致性差或可变性大是数字内存应用的主要障碍。相比之下,神经网络对器件变化具有潜在的鲁棒性。有两种机制可以部分容忍器件变化:通过突触阵列在神经元节点之间建立大量(因此可能是冗余的)连接,以及在线训练器件的迭代权重更新过程。在系统级别上可以容忍的变化程度很大程度上取决于网络体系结构和目标应用所需的准确性。最近的结果表明,不同神经网络中的器件变化具有合理的鲁棒性[1][4]。然而,对于带有写验证的离线训练,由于网络在推理过程中无法自我适应,对一致性的要求更加严格。

1.2代表性材料、系统和器件原型

在过去的几年里,许多具有数十到数百种电导状态的电阻性突触器件的候选器件已经在单个器件级别上得到了证实。除了模拟电导调谐能力外,生物现实行为,如短期记忆、对脉冲易化和尖峰时间依赖可塑性已在各种器件中得到仿真,包括基于Ag/Ag2S的CBRAM[5]、Cu/Cu2S的CBRAM[6]、基于Ag/GeS2的CBRAM[7]、基于Ag/Ge30Se70的CBRAM[8]、基于Ag/SiOxNy的CBRAM[9]、基于TiOx的OxRAM[10]、基于HfOx的OxRAM[4][11][12]、基于WOx的OxRAM[13][14]、基于TaOx的OxRAM等[15]。然而,到目前为止,这些似生物的特征如何促进系统级别的计算尚不清楚,后续将仅调查已报道的用于实现人工神经网络的器件的模拟权重更新特性。图2为一些代表性关键厂商布局基于eNVM的存储技术,以及为“存内计算”(类脑计算)应用做准备。

图片3.png 

图2关键厂商布局新兴存储技术,以及为“存内计算”(类脑计算)应用做准备。

参考目录:

[1] P.-Y. Chen et al., “Mitigating effects of nonideal synaptic device characteristics for on-chip learning,” in Proc. IEEE/ACM Int. Conf. Comput.-Aided Design (ICCAD), Nov. 2015, pp. 194–199.

[2] G. W. Burr, R. M. Shelby, C. D. Nolfo, J. W. Jang, R. S. Shenoy, and P. Narayanan, “Experimental demonstration and tolerancing of a large-scale neural network (165,000 synapses), using phase-change memory as the synaptic weight element,” in IEDM Tech. Dig., 2014.

[3] MNIST Handwritten Digits Dataset. [Online]. Available: http://yann.lecun.com/exdb/mnist/

[4] D. Garbin, “Variability-tolerant convolutional neural network for pattern recognition applications based on OxRAM synapses,” in IEDM Tech. Dig., 2014.

[5] T. Ohno, T. Hasegawa, T. Tsuruoka, K. Terabe, J. K. Gimzewski, and M. Aono, “Short-term plasticity and long-term potentiation mimicked in single inorganic synapses,” Nature Mater., vol. 10, pp. 591–595, Aug. 2011.

[6] A. Nayak, “Controlling the synaptic plasticity of a Cu2S gap-type atomic switch,” Adv. Funct. Mater., vol. 22, pp. 3606–3613, 2012.

[7] M. Suri, “CBRAM devices as binary synapses for low-power stochastic neuromorphic systems: Auditory (Cochlea) and visual (Retina) cognitive processing applications,” in IEDM Tech. Dig., 2012.

[8] D. Mahalanabis, H. J. Barnaby, Y. Gonzalez-Velo, M. N. Kozicki, S. Vrudhula, and P. Dandamudi, “Incremental resistance programming of programmable metallization cells for use as electronic synapses,” Solid-State Electron., vol. 100, pp. 39–44, Oct. 2014.

[9] Z. Wang et al., “Memristors with diffusive dynamics as synaptic emulators for neuromorphic computing,” Nature Mater., vol. 16, pp. 101–108, Mar. 2017.

[10] K. Seo et al., “Analog memory and spiketiming-dependent plasticity characteristics of a nanoscale titanium oxide bilayer resistive switching device,” Nanotechnology, vol. 22, no. 25, p. 254023, Jun. 2011.

[11] S. Yu, Y. Wu, R. Jeyasingh, D. Kuzum, and H.-S. P. Wong, “An electronic synapse device based on metal oxide resistive switching memory for neuromorphic computation,” IEEE Trans. Electron Devices, vol. 58, no. 8, pp. 2729–2737, Aug. 2011.

[12] S. Ambrogio et al., “Neuromorphic learning and recognition with one-transistor-oneresistor synapses and bistable metal oxide RRAM,” IEEE Trans. Electron Devices, vol. 63, no. 4, pp. 1508–1515, Apr. 2016.

[13] T. Chang, S.-H. Jo, and W. Lu, “Short-term memory to long-term memory transition in a nanoscale memristor,” ACS Nano, vol. 5, pp. 7669–7676 , Sep. 2011.

[14] C. Du, W. Ma, T. Chang, P. Sheridan, and W. D. Lu, “Biorealistic implementation of synaptic functions with oxide memristors through internal ionic dynamics,” Adv. Funct. Mater., vol. 25, pp. 4290–4299, Jun. 2015.

[15] S. Kim, C. Du, P. Sheridan, W. Ma, S. Choi, and W. D. Lu, “Experimental demonstration of a second-order memristor and its ability to biorealistically implement synaptic plasticity,” Nano Lett., vol. 15, no. 3, pp. 2203–2211, 2015.