编辑推荐:
ASD 传统诊断依赖主观问卷评估,准确性受限。本研究针对 rs-fMRI 数据高维性及生物标志物识别难题,融合表型与 rs-fMRI 数据,采用 PCA、AE 降维及 XAI 分析,在 ABIDE 1 数据集获良好效果,为 ASD 客观诊断提供新方向。
自闭症(Autism Spectrum Disorder, ASD)作为一种影响全球约 1% 人口的神经发育障碍,正随着时间推移呈现患病率上升的趋势。当前,临床诊断 ASD 主要依赖基于问卷的主观评估,如《精神疾病诊断与统计手册第五版》(DSM-V),这种方式极大地受制于临床医生的经验与理解,容易导致诊断偏差。而神经影像学技术的兴起,尤其是静息态功能磁共振成像(resting-state functional MRI, rs-fMRI),因其能客观捕捉大脑功能连接的特性,为 ASD 的精准诊断带来了新希望。不过,rs-fMRI 数据具有四维高维特性,包含数十万个体素,不仅使手动分析困难重重,还容易引发模型过拟合、泛化能力差等问题。此外,如何从复杂的神经影像数据中挖掘出具有临床价值的生物标志物,即能反映 ASD 特征的脑区或功能连接,也是制约 ASD 自动化诊断发展的关键瓶颈。
为突破上述困境,国内研究人员围绕 ASD 的客观诊断展开了深入研究。他们提出了一种基于机器学习的端到端 ASD 诊断模型,相关成果发表在《Biomedical Signal Processing and Control》。该研究旨在通过整合多模态数据与先进算法,实现 ASD 的精准分类,并挖掘潜在的生物标志物,为临床提供更可靠的诊断依据。
研究人员主要采用了以下关键技术方法:首先,数据来源于公开的多站点自闭症脑成像数据交换库(ABIDE 1),包含表型数据(如人口统计信息)和 rs-fMRI 数据。在数据处理阶段,运用主成分分析(Principal Component Analysis, PCA)和卷积自编码器(Convolutional Autoencoder, AE)两种无监督降维技术对 rs-fMRI 数据进行特征提取,以解决高维数据问题。同时,采用早期融合策略,将降维后的 rs-fMRI 特征与表型数据融合,充分利用多模态数据的互补信息。在分类模型构建上,使用了逻辑回归、支持向量机(SVM)、随机森林等七种分类器,并通过留一站点交叉验证(leave-one-site-out cross-validation, LOSO-CV)评估模型的泛化能力。最后,借助可解释人工智能(eXplainable Artificial Intelligence, XAI)技术,如 SHapley Additive exPlanations(SHAP)和梯度类激活映射(Gradient Class Activation Mapping, Grad-CAM),对模型进行后验分析,识别潜在的生物标志物。
实验结果与分析
- 整体数据训练结果:当在所有站点的合并数据上训练模型时,采用逻辑回归分类器获得了 64.9% 的分类准确率,初步验证了模型整合多模态数据进行 ASD 分类的可行性。
- 单个站点数据训练结果:在对各个独立站点的数据进行训练和评估时,KKI 站点的数据表现最为突出,模型在该站点数据上的准确率高达 83%。这表明不同站点的数据特性可能对模型性能产生显著影响,也反映出模型在特定数据分布下具有较强的分类能力。
- 留一站点交叉验证结果:为了评估模型在不同站点间的泛化能力,研究人员进行了留一站点交叉验证。结果显示,使用线性核的支持向量机(SVM)分类器时,取得了 65.3% 的最佳准确率。这一结果表明,该模型在跨站点的 ASD 诊断中具有一定的通用性,但同时也提示不同站点间的数据差异仍需进一步关注和处理。
- 降维技术效果比较:通过对比 PCA 和卷积 AE 两种降维技术在模型中的表现,发现卷积 AE 的性能优于 PCA。这说明在处理 rs-fMRI 这种复杂的非线性数据时,基于神经网络的 AE 算法能够更有效地捕捉数据中的潜在特征,为 ASD 的分类提供更具判别性的信息。
- 生物标志物识别:利用 XAI 技术对训练好的模型进行后验分析,识别出了一些关键的脑区和功能连接作为 ASD 诊断的潜在生物标志物。其中,脑区包括额上回(superior frontal gyrus)、楔前叶皮层(precuneus cortex)等,这些脑区在 ASD 患者的神经活动中可能存在异常。功能连接方面,脑干 - 小脑(Brain Stem - Cerebellum)等重要连接被发现与 ASD 的发生发展密切相关。这些生物标志物的识别为深入理解 ASD 的神经机制提供了重要线索。
结论与讨论
本研究构建的端到端早期融合机器学习诊断模型,成功整合了 rs-fMRI 和表型数据,有效解决了 ASD 诊断中数据高维性和生物标志物识别的关键问题。实验结果表明,早期融合策略能够显著提升模型的分类性能,卷积 AE 在降维方面优于传统的 PCA 算法,为 ASD 的自动化诊断提供了更优的技术选择。通过 XAI 技术识别出的额上回、楔前叶皮层等脑区及脑干 - 小脑等功能连接作为潜在生物标志物,不仅为 ASD 的病理机制研究提供了新视角,也为临床医生提供了可解释的诊断依据,有助于提高 ASD 诊断的可靠性和客观性。
该研究的重要意义在于,它首次将早期融合策略与可解释人工智能技术相结合,为 ASD 的精准诊断提供了一种兼具高效性和可解释性的新方法。未来,若能进一步扩大样本量、整合更多模态数据(如结构 MRI、代谢组学数据等),并开展纵向研究跟踪 ASD 患者的病程发展,有望进一步提升模型的性能和生物标志物的临床应用价值,推动 ASD 诊断从主观经验性评估向客观精准化诊断的转变。