
-
生物通官微
陪你抓住生命科技
跳动的脉搏
神经自适应延迟微分方程:基于可学习延迟的连续深度网络模型创新
【字体: 大 中 小 】 时间:2025年06月17日 来源:Neurocomputing 5.5
编辑推荐:
针对固定延迟神经网络(NDDEs)难以适应多任务需求的问题,研究人员提出神经自适应延迟微分方程(NADDEs),通过将训练过程重构为无延迟最优控制问题,利用变分法自主学习最优延迟参数。实验表明NADDEs不仅能精准重建具有延迟效应的物理系统(如Mackey-Glass系统),还在MNIST/CIFAR-10/SVHN图像分类任务中超越NODEs和NDDEs,为复杂时序建模提供新范式。
在人工智能与动力系统交叉领域,神经普通微分方程(NODEs)通过将残差网络(ResNet)的离散层转化为连续时间动力学,开辟了连续深度神经网络的新方向。然而这类模型存在固有缺陷:其拓扑结构限制了对交叉反射等复杂映射的学习能力,且传统神经延迟微分方程(NDDEs)依赖预设固定延迟参数,难以适应不同任务对历史信息利用的差异化需求。当面对如生理信号分析或气候预测等具有未知延迟效应的系统时,固定延迟可能导致关键时序特征的丢失。
为解决这一瓶颈,中国科学院深圳先进技术研究院的Chao Zhou团队在《Neurocomputing》发表研究,提出神经自适应延迟微分方程(NADDEs)。该模型突破性地将延迟参数τ转化为可学习变量,通过最优控制框架和伴随算法实现延迟值的自主优化。理论推导证明该方法能建立动态时空"跳跃连接",使模型根据任务需求灵活调整历史信息利用深度。
关键技术包括:1) 构建含自适应延迟项的微分方程框架;2) 采用伴随方法进行参数梯度计算;3) 基于Mackey-Glass系统验证延迟学习能力;4) 在MNIST/CIFAR-10/SVHN数据集评估分类性能。通过对比τ*=0.1的固定延迟NDDEs,NADDEs成功捕捉传统模型无法学习的交叉函数动态。
【重构具有延迟效应的物理系统】
以经典Mackey-Glass系统为测试平台,该微分方程dx(t)/dt=0.2x(t-17)/[1+x10
(t-17)]-0.1x描述生理振荡现象。NADDEs仅通过观测数据即准确学习到真实延迟τ=17,而NODEs和固定延迟NDDEs均无法重建系统动力学。
【图像分类任务验证】
在MNIST/CIFAR-10/SVHN基准测试中,NADDEs分类准确率显著超越对比模型。可视化分析表明自适应延迟机制能自主建立多层特征复用路径,例如在CIFAR-10任务中学习到τ=3.2的优化延迟,对应卷积神经网络中的跨层短路连接。
研究结论揭示,将延迟参数纳入可学习范畴能突破连续深度网络的表达能力瓶颈。方法论层面提出的最优控制框架为微分方程类模型提供通用参数优化范式;应用层面展示的未知延迟学习能力,为脑科学、流体力学等涉及隐含延迟的复杂系统建模开辟新途径。该成果被审稿人评价为"首次实现延迟动力学与深度学习的高度自适应融合"。
生物通微信公众号
知名企业招聘