GenPath-PPH:通过持久路径同源性整合基因表达和通路网络,提高疾病相关通路的检测效率

《Computational and Structural Biotechnology Journal》:GenPath-PPH: Integrating gene expression and pathway networks via persistent path homology enhances detection of disease-relevant pathways

【字体: 时间:2025年11月13日 来源:Computational and Structural Biotechnology Journal 4.1

编辑推荐:

  基因表达与通路网络整合分析框架GenPath-PPH利用持久路径同调(PPH)检测疾病相关通路拓扑结构动态变化,在肝细胞癌PBMC样本中成功识别JAK-STAT、NF-κB等已知通路及氨基酸tRNA合成等潜在新靶点,通过方向性约束网络过滤噪声,结合Kolmogorov-Smirnov检验和Cohen效应量评估,显著优于传统基因集富集方法。

  在当今生物医学研究中,理解特定疾病相关的生物通路对于揭示其分子机制至关重要。传统方法,如基因集分析,通常忽略基因在实际生物通路中相互作用的拓扑关系,这限制了它们对疾病过程背后的复杂网络变化的捕捉能力。为了解决这一问题,本文介绍了一种新型框架——GenPath-PPH(基因表达与通路网络整合的持久路径同调),它结合了基因表达数据与定向生物通路网络,利用持久路径同调(Persistent Path Homology, PPH)这一拓扑工具来分析方向性关系。GenPath-PPH追踪疾病与对照条件之间基因相互作用的关联强度变化,并将这些差异解释为通路网络中与疾病相关的拓扑变化。它不仅能够识别通路内部的连接组件(共表达簇)的变化,还能检测更高阶的结构变化,如定向循环,这些变化在传统同调方法中无法被捕捉到。通过结合连接性和循环性特征,并使用排列检验评估统计显著性,GenPath-PPH能够突出显示显著改变的通路。

为了进一步理解GenPath-PPH的优势,我们以肝细胞癌(HCC)患者的外周血单核细胞(PBMC)样本为例,展示了该方法的应用效果。GenPath-PPH不仅能够识别已知的癌症相关通路,如JAK-STAT信号通路、p53信号通路和磷酸戊糖途径,还能发现其他通路,这些通路要么被其他方法遗漏,尽管它们与HCC有已知的相关性,要么代表了具有实验评估潜力的新候选通路。这些发现表明,GenPath-PPH不仅能够揭示通路的拓扑结构,还能揭示其功能活动之间的潜在联系,从而为理解疾病相关的生物网络提供了新的视角。

传统方法在分析基因表达数据时,往往依赖于基因集合的表达变化,而忽略了网络拓扑和动态基因关系。这种方法的局限性在于,它难以捕捉驱动生物过程的协作性相互作用。相比之下,基于拓扑的方法,如使用中心性指标或位置重要性来分析,虽然部分解决了这一问题,但它们无法建模动态、多尺度的拓扑变化。因此,这些方法在处理需要细微网络重排以揭示关键生物转变的情境中存在重要局限性。

GenPath-PPH的提出正是为了解决上述问题。该方法通过使用持久路径同调来整合基因表达数据与通路网络,从而提供一种动态和多尺度的视角。在研究中,我们使用了KEGG数据库中的通路信息,并通过将基因表达数据与通路网络结合,分析了通路结构如何随不同生物条件而变化。这种整合方法能够克服静态方法的局限性,使得对通路活动在响应变化条件时的分析成为可能。

在研究方法部分,我们详细描述了基因表达数据的处理流程,包括使用Transcripts Per Million(TPM)进行归一化,以及使用log2变换稳定方差。随后,我们从KEGG数据库中提取了251个代谢和信号通路及其对应的基因集合,并利用R语言的工具包进行了数据处理。为了构建通路网络,我们根据KEGG Markup Language(KGML)文件解析了通路间的相互作用,并将KEGG基因ID转换为NCBI基因符号,以确保与HCC基因表达数据的一致性。对于每个处理后的通路,我们构建了一个包含所有相关基因的网络,并根据Kegg定义的相互作用添加了定向边。

在分析基因表达数据时,我们采用了基于相关性的距离度量,替代了传统方法中使用的欧几里得距离。这种方法强调了强基因相互作用,同时过滤了弱相关性带来的噪声。通过逐步增加过滤阈值(从0到1,步长为0.01),我们追踪了基因之间的连接性变化,并计算了Betti数(用于量化不同维度的拓扑特征)。为了评估通路间的差异,我们使用了Kolmogorov-Smirnov(KS)检验和Cohen’s效应大小作为两个互补的指标。这些方法帮助我们识别出在通路层面有显著差异的基因相互作用模式,并通过排列检验来控制假发现率(FDR)。

在结果部分,我们展示了GenPath-PPH在PBMC样本中的应用效果。通过对所有通路的Betti数进行分析,我们发现GenPath-PPH能够有效识别出与HCC相关的通路,并且这些通路在通路结构上表现出显著的拓扑差异。与传统的分析方法相比,GenPath-PPH不仅能够识别出已知的癌症相关通路,还能够发现一些可能未被充分研究的通路,如NF-κB信号通路、鞘脂信号通路和氨基酰-tRNA生物合成通路。这些通路在疾病条件下表现出独特的拓扑特征,可能对疾病的进展和治疗策略具有重要意义。

此外,我们还比较了GenPath-PPH与其他三种通路分析方法的检测结果,包括基于拓扑的pH-TD、基因集富集分析(GSEA)和超几何富集分析(HGEA)。结果显示,GenPath-PPH在检测通路层面的显著差异方面具有更高的特异性。与传统方法相比,GenPath-PPH能够捕捉到方向性通路相互作用的变化,从而揭示出更深层次的生物机制。这些发现不仅验证了GenPath-PPH的有效性,还展示了其在生物医学研究中的潜力。

尽管GenPath-PPH在识别通路层面的显著变化方面表现出色,但该方法仍面临一些挑战。例如,处理大规模数据集时的计算成本较高,这可能限制了其在实际应用中的可扩展性。此外,由于我们的数据集样本量较小(17名HCC患者和17名健康对照),在检测细微通路差异时的统计功效可能受到限制。因此,未来的研究可以考虑使用更大规模和更多样化的数据集,以评估GenPath-PPH的通用性和鲁棒性。同时,可以探索该框架在其他多组学数据(如蛋白质组学、代谢组学)中的应用,以提高其适用范围和灵活性。

GenPath-PPH的提出不仅拓展了拓扑数据分析在生物学中的应用,还为理解疾病相关的生物网络提供了新的工具。通过将基因表达数据与通路网络整合,GenPath-PPH能够揭示出传统方法难以捕捉的细微变化,从而为疾病机制的深入研究提供了新的思路。该方法的未来发展方向包括与生物知识图谱(KGs)的整合,以增强其生物解释性和假设生成能力。通过这些扩展,GenPath-PPH有望成为生物医学研究中的重要工具,为揭示疾病相关的基因相互作用网络提供更全面和深入的分析。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号