基于高斯过程功能回归的细胞类型特异性差异甲基化区域检测方法FineDMR及其在表观基因组关联研究中的应用

【字体: 时间:2025年07月16日 来源:Bioinformatics 4.4

编辑推荐:

  本研究针对表观基因组关联研究(EWAS)中细胞类型特异性信号解卷积难题,开发了基于贝叶斯层次模型和高斯过程功能回归的FineDMR方法。该方法通过利用CpG位点的空间依赖性,显著提高了细胞类型特异性差异甲基化区域(DMR)的检测效能,在模拟和真实数据分析中展现出优于现有方法(HIRE/TOAST/TCA/CellDMC)的统计功效,为解析复杂组织表观遗传调控机制提供了新工具。

  

在表观遗传学研究领域,DNA甲基化作为最重要的表观遗传标记之一,其异常调控与多种疾病密切相关。然而当前基于混合组织的表观基因组关联研究(EWAS)面临重大挑战:常规检测获得的甲基化数据是不同细胞类型信号的混合体,而细胞组成差异会严重干扰关联分析结果。更棘手的是,表型变化可能同时影响细胞比例和细胞特异性甲基化水平,这使得从混合信号中解析细胞类型特异性关联变得异常困难。

香港中文大学统计系的研究团队在《Bioinformatics》发表的研究中,开发了名为FineDMR的创新方法。该方法通过建立基于高斯过程功能回归的贝叶斯层次模型,首次实现了对细胞类型特异性差异甲基化区域的精细检测。研究显示,FineDMR不仅能准确推断各细胞类型的基线甲基化谱,还可识别表型相关的细胞类型特异性DMR,同时直接从未纯化数据中估计样本的细胞组成比例。

关键技术方法包括:(1)构建高斯过程功能回归模型处理空间相关的CpG位点数据;(2)采用B样条基函数建模细胞类型特异性甲基化曲线;(3)开发广义期望最大化(GEM)算法进行参数估计;(4)基于Wald检验识别显著DMR。分析使用了类风湿性关节炎(RA)患者队列(n=689)和GALA II拉丁裔儿童血液甲基化数据集(n=573)。

研究结果

  1. 模型优势验证:模拟研究显示,在样本量n=300时FineDMR细胞类型特异性检测效能达82.1%,显著高于HIRE(4.9%)等现有方法;当n=1000时,其效能进一步提升至98.4%。

  2. RA数据集分析:识别出CD14+单核细胞(33个DMR)、CD4+T细胞(29个DMR)和CD8+T细胞(31个DMR)中与RA最相关的甲基化区域,富集分析显示这些DMR关联基因显著参与造血细胞谱系、阿米巴病和紧密连接等RA相关通路。

  3. GALA II数据集分析:在CD14+单核细胞中发现132个与性别相关的DMR,其中包含嗅觉传导通路基因(OR2C3/OR2G3等),这与已知的性别二态性生物学特征高度一致。

这项研究的突破性在于:首次将功能数据分析框架引入细胞类型特异性EWAS解析,通过利用CpG位点的空间相关性大幅提升检测效能。相比现有方法,FineDMR不需要预先测定细胞比例即可实现:(1)细胞类型特异性基线甲基化谱推断;(2)表型关联效应的细胞类型解析;(3)样本特异性细胞组成估计;(4)个体化甲基化谱重建。该方法为复杂疾病的表观遗传机制研究提供了新范式,其开源实现将极大促进精准表观遗传学的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号