冯·诺依曼架构由于内存与处理器分离的设计,难以满足人工智能(AI)日益增长的需求,从而导致能源效率低下和计算瓶颈[1,2]。相比之下,人脑凭借其高度互联的神经网络,展现出卓越的并行数据处理能力和多感官整合能力,且能耗极低[3,4]。受这种生物效率的启发,神经形态学计算系统旨在模仿大脑的突触功能,其中人工突触设备作为处理复杂感官输入(如视觉和听觉信号)的关键组件[5,6]。然而,大多数报道的人工突触仅限于单模处理,无法复制大脑整合多种感官模式的能力,从而限制了其在实际应用中的效果。
多模态感官处理对于能够应对现实世界挑战的先进神经形态学系统至关重要[[7], [8], [9]]。在听觉处理中,神经形态学模型模拟人类听觉皮层的时间动态以提取语音特征。Cao等人开发了用于关键词检测(KWS)任务的人工突触,通过模拟突触塑性,在音素序列识别中实现了94.6%的准确率。同样,受Bienenstock-Cooper-Munro(BCM)学习规则启发的突触设备,采用双结W/WO2/WO3-x/Au结构实现语音识别,通过非单调权重变化增强特征区分能力,并通过阈值滑动适应噪声,在无噪声CNN模拟中实现了98%的准确率,但在13%的高斯噪声环境下准确率降至83%[10]。与此同时,基于钙钛矿或有机材料的光电突触在视觉任务(如图像记忆和颜色识别)中表现出色,通过光诱导的突触后电流(EPSC)调制实现[[11], [12], [13]]。然而,这些单模系统难以应对环境噪声,并且缺乏跨模态整合能力,限制了它们在需要同时处理听觉和视觉输入的复杂场景中的性能。
金属有机框架(MOFs)凭借其可调结构和高孔隙率,成为神经形态学应用的有希望的候选材料,提供了一个多功能平台来克服这些限制[14,15]。与传统MOFs不同,后者存在电荷传输不足的问题[16],而二维共轭MOFs(2D c-MOFs),如Cu3(HHTP)2(HHTP:2,3,6,7,10,11-六羟基三苯ylene),通过平面π共轭和层间π-π堆叠实现了高导电性,同时还具有高孔隙率和可扩展的合成方法[[17], [18], [19]]。尽管Cu3(HHTP)2已在能量存储[20,21]、光检测[22,23]和传感[19,24,25]领域得到应用,但由于其稀缺性和制备高质量薄膜的难度,其在神经形态学计算中的应用,尤其是多模态感官处理方面的应用尚未得到充分探索。此外,作为一种新材料,其在相关刺激下的动态光电塑性尚未得到全面研究[26]。
在这项工作中,我们报道了一种基于Cu3(HHTP)2薄膜的双端光电突触,该突触通过层叠自组装方法制备,能够在从紫外(UV)到可见光的不同波长范围内实现宽带光谱响应。该设备模拟了突触塑性行为,包括成对脉冲促进(PPF)、脉冲宽度依赖的塑性(SWDP)、脉冲频率依赖的塑性(SRDP)和脉冲强度依赖的塑性(SDDP)。此外,Cu3(HHTP)2薄膜的宽吸收特性使其能够应用于颜色区分和联想记忆。提取的突触响应参数被用于构建神经形态学语音识别系统,在嘈杂环境中实现了高识别准确率,超过了传统的单模听觉模型。这些结果突显了基于Cu3(HHTP)2的光电突触作为下一代神经形态学系统基础构建块的潜力,能够高效处理复杂感官输入。