多模态自适应融合深度分析模型：探索阿尔茨海默病诊疗新路径及其生物标志物发现

《Computers in Biology and Medicine》：Multimodal adaptive fusion deep analysis model for Alzheimer's disease exploration and diagnosis

【字体：大中小】 时间：2025年10月09日 来源：Computers in Biology and Medicine 6.3

编辑推荐：

　　本文推荐一种创新的多模态自适应融合深度关联分析模型（MAFDAA），该模型整合多头部注意力机制与图卷积网络（GCN），有效提取多模态脑影像与遗传数据中的互补信息，并通过非线性关联分析挖掘阿尔茨海默病（AD）相关生物标志物。实验表明MAFDAA在疾病诊断与机制解读方面表现卓越，为神经退行性疾病研究提供从微观基因到宏观表型的全新分析框架。

Highlight

本研究提出了一种全新的多模态自适应融合深度关联分析模型（MAFDAA），用于探索阿尔茨海默病（AD）中多模态脑影像与遗传数据之间的复杂非线性关系，并构建了一条基于关联分析结果的可解释路径，以应对深度学习关联分析中解释性较弱的问题。

Introduction

阿尔茨海默病（AD）是一种典型的神经退行性疾病，涉及大脑中多种异常变化。尽管过去十年进行了广泛研究，其发病机制仍未完全明确。研究表明，患者可能经历不同阶段的认知障碍，如早期轻度认知障碍（EMCI）或晚期轻度认知障碍（LMCI），其中约10%–15%的患者会逐年恶化为AD。AD的发病机制复杂，并非单一原因所致，而是多种渐进过程共同作用的结果。

脑成像遗传学是一个新兴领域，广泛关注神经影像数据——如磁共振成像（MRI）、脑代谢正电子发射断层扫描（FDG-PET）、¹⁸F-氟比他泊 PET（AV45-PET）——与遗传数据（如单核苷酸多态性，SNPs）之间的内在联系。该领域旨在建立从微观遗传分子到宏观脑表型的完整证据链，以解释痴呆的发病机制，并在大规模遗传数据中挖掘与神经影像相关的信息，进一步证实遗传数据对大脑表征的贡献。

从技术角度分析，成像遗传学方法可分为两大类：基于机器学习的关联方法和基于深度学习的关联方法。机器学习中目前以双多变量相关方法为主，这些方法同时考虑多个神经影像特征与多个基因型之间的关系，从而揭示基因与大脑结构或功能之间的复杂关联。尽管传统机器学习方法具有强大的学习、推理和解释能力，在生物医学影像领域显示出广泛价值，但随着生物医学数据日益复杂，这些方法的有效性逐渐受到挑战。

面对生物医学数据复杂性的增加，深度学习正成为成像遗传学中一种前景广阔的方法。卷积神经网络（CNN）为自动从数据中提取特征提供了更自然的工具，使这些特征可用于分类、识别和检测任务。因此，在研究早期，Andrew等人提出了基于深度神经网络的双多变量相关方法（DCCA）以处理非线性关联问题。在此基础上，Li等人开发了深度典型相关稀疏自编码器（DCCASAE），用于复杂非线性变换和降维。同时，Wang等人构建了一种深度自重建方法，以识别与功能连接表型相关的遗传关联。然而，这些方法仍未完全脱离传统机器学习框架，在处理复杂高维数据时表现不佳。在最近的研究中，Ko等人建立了深度生成判别（DGDL）的基础框架，通过考虑复杂数据分布来解释表型与遗传特征之间的非线性关系，取得了有希望的结果。Wang等人提出了一种称为深度多模态解耦关联分析网络（DMAAN）的新型深度学习框架，该框架通过多模态解耦模块将影像数据分解为共享特征和特定特征，并利用关联分析模块建立影像数据与遗传数据之间的复杂关联。

基于上述研究，本研究设计了一种新的多模态自适应融合深度关联分析模型（MAFDAA），用于分析多模态脑影像与遗传数据之间的非线性关联，并基于关联分析结果建立了一种新的可解释路径，以解决深度学习关联分析中解释性较弱的问题。

Section snippets

Dataset and preprocessing

本研究使用的所有数据均来自ADNI数据库（https://adni.loni.usc.edu/）。我们收集了ADNI数据集中的618名受试者，将其分为四个诊断组：正常对照组（NC）、EMCI、LMCI和AD。表1提供了这些参与者的详细人口统计学信息。对于人口统计学信息，性别采用二进制编码（男性为[1, 0]，女性为[0, 1]），而教育水平和年龄采用标量值表示。

Methods

该框架由四个关键模块组成，每个模块具有独特功能。首先，多模态融合模块利用不同模态传递的互补信息，提取和重建特征，从而捕获关键信息并构建大脑信息的全面表征。其次，表达模块专注于提取SNP特征并结合人口统计学信息，以增加遗传信息的丰富性。第三，关联分析模块研究融合脑影像与遗传数据之间的非线性关联，探索潜在遗传表征。一方面，潜在特征向量与人口统计学信息结合，作为关联分析模块的输入；另一方面，在整个关联分析过程中，不断生成注意力掩码向量，用于后续诊断和生物标志物识别。同时，整合的脑影像信息作为判别数据，不断优化生成的注意力掩码向量。最后，诊断模块用于AD诊断和预测。此外，该模块整合了SHapley加性解释（SHAP），利用博弈论中的Shapley值计算每个特征对预测结果的贡献，并选择有意义的生物标志物。

Experimental setup

所提出的框架在配备NVIDIA GeForce 3080 GPU的工作站上使用Tensorflow2.8实现。在对比实验中，将该框架与最先进的机器学习和深度学习方法进行了比较。在传统机器学习方法中，典型的诊断方法包括…

Identification of pathogenic factors and pathways

为进一步识别AD的遗传机制，我们分别进行了基因功能关联分析、疾病关联分析、KEGG分析和GO富集网络分析，结果如图5所示。与AD相关的疾病和生物过程在图中用红色框标注，神经系统疾病用绿色框标注。首先，我们对模型获得的基因进行了功能关联分析。图5a展示了基因的功能…

Conclusion

在本研究中，提出了一种基于多模态融合成像遗传学的新型深度学习框架。MAFDAA学习了神经影像和遗传数据的分布特征，并利用所学信息进行生物医学应用。基于多种分析，观察到框架中的每个模块都发挥着重要作用，且本章提出的综合框架代表了与早期研究一致的神经科学合理特征。

热点排行