
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于通路先验的深度神经网络甲基化分析(PROMINENT):一种用于表型预测的可解释基因水平DNA甲基化深度学习方法
【字体: 大 中 小 】 时间:2025年08月30日 来源:Artificial Intelligence in Medicine 6.2
编辑推荐:
本文推荐:研究者开发了PROMINENT(整合通路信息的深度神经网络甲基化分析),这是一种创新性的可解释深度学习模型,通过整合基因水平DNA甲基化数据与GO/KEGG通路先验知识,显著提升了表型预测准确性(如儿童哮喘、特发性肺纤维化IPF和首发精神病FEP)。该方法采用SHAP(SHapley加性解释)技术解析关键基因和通路,在计算效率和生物学解释性上均优于传统方法(如弹性网络和MethylNet)。
亮点
• 提出PROMINENT框架,首次将通路先验知识整合到DNA甲基化深度学习中
• 通过SHAP值实现"黑箱模型"的可视化解读,精准锁定疾病相关基因(如GATA3在哮喘中的作用)
• 在IPF和FEP数据集上AUC提升15-20%,计算速度较MethylNet快3倍
背景
DNA甲基化(DNAm)作为哺乳动物发育关键的表观遗传标记,受遗传变异[1]和环境因素[2]双重调控。传统EWAS(表观基因组关联研究)采用的线性模型(如弹性网络)难以捕捉甲基化-表型间的非线性关系,而现有深度学习方法(如MethylNet)又缺乏生物学解释性。
方法创新
PROMINENT采用四级架构:
基因水平聚合:将CpG位点β值通过滑动窗口法整合为基因甲基化评分
通路先验层:加载KEGG通路中基因共调控关系作为模型约束条件
混合学习:并联使用全连接层和注意力机制捕捉跨通路交互
SHAP解析:通过博弈论算法量化各通路贡献度(例如发现IL-4信号通路在哮喘中SHAP值达0.32)
结论
PROMINENT成功破解了甲基化数据的"高维度诅咒",其创新性体现在:
① 首次实现通路指导下的甲基化深度学习(GO版模型F1-score达0.89)
② 计算耗时从MethylNet的72小时缩短至<24小时
③ 发现IPF中TGF-β通路甲基化异常的新证据
生物通微信公众号
知名企业招聘