多模态自适应融合深度分析模型:探索阿尔茨海默病诊疗新路径及其生物标志物发现
《Computers in Biology and Medicine》:Multimodal adaptive fusion deep analysis model for Alzheimer's disease exploration and diagnosis
【字体:
大
中
小
】
时间:2025年10月09日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
本文推荐一种创新的多模态自适应融合深度关联分析模型(MAFDAA),该模型整合多头部注意力机制与图卷积网络(GCN),有效提取多模态脑影像与遗传数据中的互补信息,并通过非线性关联分析挖掘阿尔茨海默病(AD)相关生物标志物。实验表明MAFDAA在疾病诊断与机制解读方面表现卓越,为神经退行性疾病研究提供从微观基因到宏观表型的全新分析框架。
本研究提出了一种全新的多模态自适应融合深度关联分析模型(MAFDAA),用于探索阿尔茨海默病(AD)中多模态脑影像与遗传数据之间的复杂非线性关系,并构建了一条基于关联分析结果的可解释路径,以应对深度学习关联分析中解释性较弱的问题。
阿尔茨海默病(AD)是一种典型的神经退行性疾病,涉及大脑中多种异常变化。尽管过去十年进行了广泛研究,其发病机制仍未完全明确。研究表明,患者可能经历不同阶段的认知障碍,如早期轻度认知障碍(EMCI)或晚期轻度认知障碍(LMCI),其中约10%–15%的患者会逐年恶化为AD。AD的发病机制复杂,并非单一原因所致,而是多种渐进过程共同作用的结果。
脑成像遗传学是一个新兴领域,广泛关注神经影像数据——如磁共振成像(MRI)、脑代谢正电子发射断层扫描(FDG-PET)、18F-氟比他泊 PET(AV45-PET)——与遗传数据(如单核苷酸多态性,SNPs)之间的内在联系。该领域旨在建立从微观遗传分子到宏观脑表型的完整证据链,以解释痴呆的发病机制,并在大规模遗传数据中挖掘与神经影像相关的信息,进一步证实遗传数据对大脑表征的贡献。
从技术角度分析,成像遗传学方法可分为两大类:基于机器学习的关联方法和基于深度学习的关联方法。机器学习中目前以双多变量相关方法为主,这些方法同时考虑多个神经影像特征与多个基因型之间的关系,从而揭示基因与大脑结构或功能之间的复杂关联。尽管传统机器学习方法具有强大的学习、推理和解释能力,在生物医学影像领域显示出广泛价值,但随着生物医学数据日益复杂,这些方法的有效性逐渐受到挑战。
面对生物医学数据复杂性的增加,深度学习正成为成像遗传学中一种前景广阔的方法。卷积神经网络(CNN)为自动从数据中提取特征提供了更自然的工具,使这些特征可用于分类、识别和检测任务。因此,在研究早期,Andrew等人提出了基于深度神经网络的双多变量相关方法(DCCA)以处理非线性关联问题。在此基础上,Li等人开发了深度典型相关稀疏自编码器(DCCASAE),用于复杂非线性变换和降维。同时,Wang等人构建了一种深度自重建方法,以识别与功能连接表型相关的遗传关联。然而,这些方法仍未完全脱离传统机器学习框架,在处理复杂高维数据时表现不佳。在最近的研究中,Ko等人建立了深度生成判别(DGDL)的基础框架,通过考虑复杂数据分布来解释表型与遗传特征之间的非线性关系,取得了有希望的结果。Wang等人提出了一种称为深度多模态解耦关联分析网络(DMAAN)的新型深度学习框架,该框架通过多模态解耦模块将影像数据分解为共享特征和特定特征,并利用关联分析模块建立影像数据与遗传数据之间的复杂关联。
基于上述研究,本研究设计了一种新的多模态自适应融合深度关联分析模型(MAFDAA),用于分析多模态脑影像与遗传数据之间的非线性关联,并基于关联分析结果建立了一种新的可解释路径,以解决深度学习关联分析中解释性较弱的问题。
Dataset and preprocessing
本研究使用的所有数据均来自ADNI数据库(https://adni.loni.usc.edu/)。我们收集了ADNI数据集中的618名受试者,将其分为四个诊断组:正常对照组(NC)、EMCI、LMCI和AD。表1提供了这些参与者的详细人口统计学信息。对于人口统计学信息,性别采用二进制编码(男性为[1, 0],女性为[0, 1]),而教育水平和年龄采用标量值表示。
该框架由四个关键模块组成,每个模块具有独特功能。首先,多模态融合模块利用不同模态传递的互补信息,提取和重建特征,从而捕获关键信息并构建大脑信息的全面表征。其次,表达模块专注于提取SNP特征并结合人口统计学信息,以增加遗传信息的丰富性。第三,关联分析模块研究融合脑影像与遗传数据之间的非线性关联,探索潜在遗传表征。一方面,潜在特征向量与人口统计学信息结合,作为关联分析模块的输入;另一方面,在整个关联分析过程中,不断生成注意力掩码向量,用于后续诊断和生物标志物识别。同时,整合的脑影像信息作为判别数据,不断优化生成的注意力掩码向量。最后,诊断模块用于AD诊断和预测。此外,该模块整合了SHapley加性解释(SHAP),利用博弈论中的Shapley值计算每个特征对预测结果的贡献,并选择有意义的生物标志物。
所提出的框架在配备NVIDIA GeForce 3080 GPU的工作站上使用Tensorflow2.8实现。在对比实验中,将该框架与最先进的机器学习和深度学习方法进行了比较。在传统机器学习方法中,典型的诊断方法包括…
Identification of pathogenic factors and pathways
为进一步识别AD的遗传机制,我们分别进行了基因功能关联分析、疾病关联分析、KEGG分析和GO富集网络分析,结果如图5所示。与AD相关的疾病和生物过程在图中用红色框标注,神经系统疾病用绿色框标注。首先,我们对模型获得的基因进行了功能关联分析。图5a展示了基因的功能…
在本研究中,提出了一种基于多模态融合成像遗传学的新型深度学习框架。MAFDAA学习了神经影像和遗传数据的分布特征,并利用所学信息进行生物医学应用。基于多种分析,观察到框架中的每个模块都发挥着重要作用,且本章提出的综合框架代表了与早期研究一致的神经科学合理特征。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号