
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习揭示阿尔茨海默病遗传学新机制:从全基因组关联分析到非线性互作网络
【字体: 大 中 小 】 时间:2025年07月23日 来源:Nature Communications 14.7
编辑推荐:
本研究通过机器学习(ML)方法分析41,686例欧洲阿尔茨海默病(AD)基因组数据,突破传统GWAS线性模型的局限,发现6个新风险位点(ARHGAP25/LY6H等),预测性能(AUC=0.692)媲美多基因风险评分(PRS),为AD精准预测提供新范式。
在阿尔茨海默病(AD)遗传学研究领域,传统全基因组关联研究(GWAS)虽然已鉴定出多个风险位点,但其线性加性模型的假设与AD复杂的生物学机制存在根本性矛盾。越来越多的证据表明,AD的遗传风险具有显著的基因-基因互作效应,特别是APOEε4等位基因与其他位点间的非线性关系。这种局限性导致GWAS方法可能遗漏大量重要的遗传变异,也制约了多基因风险评分(PRS)的预测精度。更令人困扰的是,现有研究显示AD相关基因的表达具有细胞类型特异性,如小胶质细胞和星形胶质细胞中的基因富集现象,但传统方法难以捕捉这种组织特异性的遗传效应。
针对这些挑战,来自英国卡迪夫大学MRC神经精神遗传学和基因组学中心的研究团队在《Nature Communications》发表了一项开创性研究。该研究创新性地将三种机器学习算法——梯度提升机(GBM)、生物通路信息神经网络(NN)和基于模型的多因子降维(MB-MDR)应用于欧洲阿尔茨海默病生物库(EADB)41,686例样本的全基因组数据,系统评估了机器学习在AD遗传学研究中的发现能力和预测性能。
研究采用的关键技术方法包括:1)对EADB联盟16个国家20,013例AD患者和21,673例对照的基因型数据进行严格质控;2)开发分布式计算框架(DAXOS)实现大规模GBM分析;3)构建基于Gene Ontology层级结构的神经网络模型(GenNet);4)采用MB-MDR算法检测SNP-SNP互作;5)使用SHAP值解释模型预测;6)在独立数据集(Jansen et al. 2019)中进行结果验证。
【预测性能】研究结果显示,机器学习模型的预测性能与传统PRS相当。梯度提升机获得最高AUC值0.692(95% CI:0.683-0.701),与PRS的0.689无显著差异。模型预测结果高度相关(GBM-NN:r=0.87),且在不同数据拆分中保持稳定。值得注意的是,GBM在不包含APOE区域训练时仍能识别更多已知AD风险基因(pFDR=0.04),表明其捕捉非APOE相关信号的能力。
【已知位点验证】机器学习成功复现了训练集中所有GWAS显著位点(p≤5×10-8),并识别出22%的既往meta分析报道位点。所有方法均正确将APOE单倍型标记SNP(rs7412/rs429358)列为最重要预测因子,而传统GWAS中rs7412排名较低。研究还验证了BIN1(rs6733839)、PICALM(rs3851179)等关键基因的lead SNP。
【新风险位点】研究发现了6个具有生物学合理性的新风险位点,其中ARHGAP25(巨噬细胞中调节吞噬作用)、LY6H(与α7烟碱受体竞争性结合)和COG7(高尔基体糖基化关键基因)在验证集中显著复制(p<0.05)。特别值得注意的是AP4E1的错义变异rs2306331,该基因编码的AP-4复合体参与淀粉样前体蛋白(APP)转运,可能独立于已知的SPPL2A位点发挥作用。
【功能富集】机器学习识别的SNP在微胶质细胞(p=0.0024)和星形胶质细胞(p=0.0083)区域显著富集,支持AD遗传风险的细胞类型特异性。STRING蛋白互作分析显示这些基因参与β淀粉样蛋白形成和APP代谢调控等AD核心通路。
【基因互作】在17,205对SNP-SNP互作测试中,研究发现13对具有显著互作效应,其中最突出的是APOE区rs405509与MS4A*区rs600550(β=0.058,pFDR=6.8×10-5)的互作,揭示了AD遗传架构的复杂性。
这项研究标志着AD遗传学研究范式的重要转变。首先,机器学习方法不仅复现了传统GWAS结果,还突破了线性模型的局限,发现了具有生物学合理性的新风险位点。其次,研究证实机器学习可以媲美PRS的预测性能,同时提供更丰富的生物学解释。第三,研究建立的标准化分析流程(包括严格的混淆因素校正和多重验证)为后续研究提供了范本。
特别值得关注的是,该方法在识别APOEε4携带者特异性遗传效应方面展现出独特优势,为理解AD的遗传异质性开辟了新途径。未来研究可进一步探索分层分析(如按APOE基因型或发病年龄分层)和联邦学习框架,以增强模型的泛化能力。这项成果不仅推动了AD遗传机制的理解,也为其他复杂疾病的遗传学研究提供了方法论参考,标志着机器学习在生物医学研究中日益成熟的应用前景。
生物通微信公众号
知名企业招聘