
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于轻量化注意力驱动Kolmogorov-Arnold网络的ADHD诊断新范式:低参数量与自适应激活函数的创新融合
【字体: 大 中 小 】 时间:2025年06月18日 来源:Psychiatry Research: Neuroimaging 2.1
编辑推荐:
针对ADHD诊断中CNN模型参数量大、计算成本高的问题,研究人员提出了一种基于Kolmogorov-Arnold网络(KAN)的轻量化框架,集成注意力特征选择、滑动窗口数据增强和新型Enhanced Mish激活函数,仅用数千参数即实现79.25%准确率,为资源受限场景提供高效解决方案。
在医疗人工智能快速发展的今天,深度学习尤其是卷积神经网络(CNN)已成为注意力缺陷多动障碍(ADHD)诊断的重要工具。然而,这些模型普遍面临"三高"困境:高参数复杂度(通常需数百万参数)、高计算资源消耗(依赖GPU等专用硬件)、高过拟合风险(医疗数据稀缺性)。这些问题严重阻碍了模型在资源有限医疗机构的应用,也降低了临床解释性。更棘手的是,ADHD作为影响全球5-9%儿童的复杂神经发育疾病,其诊断仍高度依赖主观临床评估,功能磁共振成像(fMRI)虽能提供客观脑连接数据,但现有分析方法效率低下。
针对这一系列挑战,研究人员开展了一项突破性研究,创新性地将数学领域Kolmogorov-Arnold定理与深度学习相结合。该团队构建了一个革命性的轻量化架构,其核心是通过Kolmogorov-Arnold网络(KAN)重构特征变换机制,相比传统多层感知机(MLP),采用边缘可学习样条函数替代固定节点激活函数,实现参数量级缩减。研究还创造性开发了Enhanced Mish激活函数,通过可学习尺度系数动态适应脑连接模式变化;设计前置注意力门控机制,在特征输入阶段即过滤冗余信息;结合滑动窗口数据增强技术解决医学数据稀缺问题。这些创新使模型在ADHD-200数据集上取得79.25%准确率的同时,参数量仅数千个,比现有方法降低三个数量级。
关键技术方法包括:1)基于ADHD-200数据集的fMRI脑连接特征分析;2)滑动窗口数据增强技术生成多样化训练样本;3)注意力驱动的特征选择模块;4)集成可学习样条函数的KAN架构;5)新型Enhanced Mish激活函数设计。实验采用五折交叉验证,评估指标包含准确率、F1值和精确率。
研究结果部分显示:
讨论部分强调,该研究实现了三重突破:首先,KAN与注意力机制的协同设计开创了医疗AI轻量化新范式;其次,动态激活函数为复杂神经信号处理提供新思路;最后,滑动窗口技术为小样本医学研究提供可行方案。临床价值在于:1)使ADHD诊断模型可部署在普通计算机;2)浅层架构增强临床解释性;3)为自闭症等神经发育障碍诊断提供方法论参考。
该研究的局限性在于未进行多中心验证,未来需在更大规模临床数据中测试泛化能力。但毋庸置疑,这种"小而精"的设计理念,为破解医疗AI落地难题提供了教科书级范例,其技术路线有望延伸至阿尔茨海默病等复杂神经系统疾病的早期筛查领域。论文成果已发表在《Psychiatry Research: Neuroimaging》,为临床诊疗与基础研究的交叉创新树立了新标杆。
生物通微信公众号
知名企业招聘