基于通路先验的深度神经网络甲基化分析(PROMINENT):一种用于表型预测的可解释基因水平DNA甲基化深度学习方法

【字体: 时间:2025年08月30日 来源:Artificial Intelligence in Medicine 6.2

编辑推荐:

  本文推荐:研究者开发了PROMINENT(整合通路信息的深度神经网络甲基化分析),这是一种创新性的可解释深度学习模型,通过整合基因水平DNA甲基化数据与GO/KEGG通路先验知识,显著提升了表型预测准确性(如儿童哮喘、特发性肺纤维化IPF和首发精神病FEP)。该方法采用SHAP(SHapley加性解释)技术解析关键基因和通路,在计算效率和生物学解释性上均优于传统方法(如弹性网络和MethylNet)。

  

亮点

• 提出PROMINENT框架,首次将通路先验知识整合到DNA甲基化深度学习中

• 通过SHAP值实现"黑箱模型"的可视化解读,精准锁定疾病相关基因(如GATA3在哮喘中的作用)

• 在IPF和FEP数据集上AUC提升15-20%,计算速度较MethylNet快3倍

背景

DNA甲基化(DNAm)作为哺乳动物发育关键的表观遗传标记,受遗传变异[1]和环境因素[2]双重调控。传统EWAS(表观基因组关联研究)采用的线性模型(如弹性网络)难以捕捉甲基化-表型间的非线性关系,而现有深度学习方法(如MethylNet)又缺乏生物学解释性。

方法创新

PROMINENT采用四级架构:

  1. 1.

    基因水平聚合:将CpG位点β值通过滑动窗口法整合为基因甲基化评分

  2. 2.

    通路先验层:加载KEGG通路中基因共调控关系作为模型约束条件

  3. 3.

    混合学习:并联使用全连接层和注意力机制捕捉跨通路交互

  4. 4.

    SHAP解析:通过博弈论算法量化各通路贡献度(例如发现IL-4信号通路在哮喘中SHAP值达0.32)

结论

PROMINENT成功破解了甲基化数据的"高维度诅咒",其创新性体现在:

① 首次实现通路指导下的甲基化深度学习(GO版模型F1-score达0.89)

② 计算耗时从MethylNet的72小时缩短至<24小时

③ 发现IPF中TGF-β通路甲基化异常的新证据

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号