
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Transformer-GAN解码牙周炎表观遗传增强子-启动子互作网络:炎症基因调控与生物标志物发现的深度学习框架
【字体: 大 中 小 】 时间:2025年09月04日 来源:International Dental Journal 3.7
编辑推荐:
本研究针对牙周炎中增强子-启动子(E-P)互作机制不明的科学问题,开发了整合DNA甲基化与RNA-seq数据的Transformer-GAN深度学习模型,成功预测262个高置信度E-P互作,揭示IL-1β、IL-6等炎症基因的协同调控网络。该模型(AUC-ROC=0.725)首次阐明牙周炎中增强子低甲基化通过NF-κB、TNF等通路驱动基因表达,其互作评分对治疗反应的预测效能(F1-score:0.82)超越传统指标,为精准诊疗提供新范式。
牙周炎作为全球高发的慢性炎症性疾病,其组织破坏机制长期困扰着临床诊疗。传统研究多聚焦于微生物因素或基因表达变化,却忽视了更高维度的表观遗传调控网络——特别是增强子(enhancer)与启动子(promoter)间的远程对话。这种三维基因组层面的调控异常,可能是驱动IL-1β、TNF等炎症因子暴发的"隐形开关"。然而,由于染色质构象检测技术(如Hi-C)的高成本与低通量,以及传统计算方法对非线性关系的捕捉不足,牙周炎的特异性基因调控图谱始终未能破解。
为突破这一瓶颈,Prabhu Manickam Natarajan与Pradeep Kumar Yadalam团队创新性地将对抗生成网络(GAN)与Transformer架构结合,开发了专用于牙周炎的多组学分析框架。研究选取GEO数据库中36例匹配的牙周组织样本(健康/牙龈炎/牙周炎各12例),通过Illumina EPIC甲基化芯片(GSE173081)和RNA-seq(GSE173078)数据,构建包含甲基化差异(Δβ)、基因表达变化(log2FC)、相关性指标等特征的预测体系。
关键技术包括:1)使用minfi包处理850K甲基化数据,经FunNorm标准化后筛选8,142个差异甲基化位点(DMPs);2)通过TMM方法标准化RNA-seq数据,鉴定733个差异表达基因(DEGs);3)设计Transformer-GAN模型,其生成器采用双头注意力机制捕捉长程依赖,判别器通过对抗训练提升数据不平衡下的泛化能力;4)功能验证采用GO/KEGG富集分析和网络拓扑学方法。
主要研究结果
Differential methylation and expression
分析发现68%的DMPs呈现低甲基化,且显著富集于增强子区域(OR=2.3)。关键炎症基因IL-1β、IL-8表达量提升2.8-3.2倍,其上游增强子甲基化水平与表达量呈强负相关(r=-0.62)。
Transformer-GAN performance
模型在测试集表现优异(AUC-ROC=0.725),甲基化变化(35%贡献度)与表达量变化(28%)被识别为最关键特征。相较传统线性模型,其捕捉非线性互作的能力使预测精度提升21%。
Identified E–P interactions
发现的262对E-P互作中,IL-8以44个互作成为最大枢纽节点,其与远端增强子的平均距离为45.2kb。Circos图显示染色体6/8存在调控热点,与已知的炎症基因簇位置吻合。
Functional characterisation
KEGG分析揭示NF-κB(P=4.5×10-11)、TNF(P=7.8×10-10)通路显著激活。时序分析显示E-P互作评分在疾病进展中保持稳定,而基因表达仅短暂波动。
讨论与意义
该研究首次绘制了牙周炎特异的E-P互作图谱,揭示增强子低甲基化通过"表观遗传开关"机制持续激活炎症网络。临床转化方面,基于5个CpG位点的诊断模型准确率达85%-90%,且E-P评分对治疗响应的预测力(F1-score:0.82)超越传统临床指标。这为开发表观遗传疗法(如靶向DNA甲基转移酶抑制剂)提供了新靶点。
研究也存在局限性:缺乏单细胞分辨率可能掩盖细胞异质性,且需通过CRISPR实验验证关键增强子功能。未来可探索唾液样本的无创检测,或将框架拓展至糖尿病等共病研究。论文发表于《International Dental Journal》,标志着深度学习在口腔表观遗传学应用的重大突破。
生物通微信公众号
知名企业招聘