
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的神经影像特征选择在ADHD诊断中的关键脑区识别与分类优化研究
【字体: 大 中 小 】 时间:2025年08月06日 来源:Journal of Multidisciplinary Healthcare 2.4
编辑推荐:
这篇综述系统阐述了如何运用Boruta、随机森林(Random Forest)、XGBoost和深度神经网络(DNN)等机器学习技术,从5937个脑体素(voxel)数据中筛选关键特征,识别与注意力缺陷多动障碍(ADHD)相关的脑区(如梭状回Fusiform Gyrus、丘脑Thalamus等),并通过ReLU激活函数的神经网络实现91.43%的分类准确率,为ADHD的神经影像诊断提供了数据驱动的新范式。
Abstract
注意力缺陷多动障碍(ADHD)作为一种复杂的神经发育疾病,其异质性脑活动模式给诊断带来挑战。本研究通过整合机器学习与神经影像技术,对5937个脑体素数据进行分析,旨在建立高精度的ADHD分类模型并识别关键生物标志物。
Introduction
ADHD主要表现为注意力不集中、多动和冲动行为,其神经机制涉及基底节区异常和多巴胺能信号紊乱。静息态功能磁共振(rs-fMRI)虽能绘制脑功能连接组,但高维度体素数据(31×37×31矩阵)需借助特征选择降维。研究采用Boruta算法、随机森林结合DALEX可解释性工具,探索ADHD的神经影像特征模式。
Materials and Methods
数据来自10名受试者的1200个时间点体素序列,预处理采用Brainnetome脑图谱模板。方法学框架包含四大场景:
K Core Percolation
通过图论中的k核渗透理论分析网络韧性,定义子图中节点最小连接数k,利用生成函数G0(x)=∑k=0∞pkxk计算泊松分布网络的渗透阈值。
Feature Selection
采用过滤法(互信息I(X;Y)=∑x∈X∑y∈Yp(x,y)log(p(x,y)/p(x)p(y)))、嵌入法(Lasso正则化argminβ(‖y-Xβ‖2+λ‖β‖1))和封装法,筛选与ADHD相关的体素特征。
Deep Learning for Voxel Classification
构建3D-CNN处理体素网格数据,卷积运算fl(x,y,z)=∑i,j,kwi,j,k·vx+i,y+j,z+k提取空间特征,配合U-Net的编码器-解码器结构和V-Net的Dice系数损失函数优化分割效果。
Dataset
数据包含180名受试者的4D矩阵(31×37×31×时间点),ADHD组在ADHD指数(-72.484 vs -34.852)和执行功能相关脑区(如右侧V5/MT+区)呈现显著差异。
Results and Analysis
Scenario 1: Dimension Reduction
PCA识别出右侧梭状回FuG_R_3_1(贡献率20.1%)、丘脑Tha_R_8_2(8.7%)等关键区域;高斯混合模型(GMM)的EM算法确定37个体素为核心聚类(对数似然值14634)。
Scenario 2: XGBoost
梯度提升模型通过SHAP值量化特征重要性,发现右侧颞上回STG_R_6_1(7.3%)与ADHD显著相关。
Scenario 3: Boruta
经过99次迭代筛选出270个重要特征,包括小脑CB_L_Crus I等区域,其Z值显著高于影子特征(p<0.001)。
Scenario 4: DNN
ReLU激活的神经网络表现最优,结合随机森林DALEX解释器时平衡准确率达91.43%,显著优于Sigmoid(89.54%)和Tanh(90.14%)。
Conclusion
研究证实整合机器学习可有效识别ADHD的神经影像标志物,其中右侧梭状回、丘脑等区域的异常活动模式具有重要诊断价值。未来将探索CNN多池化策略以提升分类精度,并进一步验证环境因素与神经发育的交互作用。
Ethics Approval
本研究使用公开二次数据,不涉及新的人体试验。
Author Contributions
研究团队在算法设计、数据分析和论文撰写方面各有分工,所有作者均参与结果解读和稿件修订。
生物通微信公众号
知名企业招聘