《Computational and Theoretical Chemistry》:Network Centrality–Driven TOPSIS Approach for Prioritizing Cancer Therapeutic Targets
编辑推荐:
基于高置信度癌症蛋白互作网络,采用TOPSIS多准则决策法筛选出26个高优先级基因,其中5个(NXF1、CDC5L、MOV10、EP300、CUL7)尚未有明确治疗关联,涉及RNA调控、泛素化降解等通路,并在多癌种生存分析中显示显著预后关联。
钱德拉莫汉·尼蒂亚(Chandramohan Nithya)| 尼莱什·巴布·图马迪(Neelesh Babu Thummadi)| P·马尼马拉兰(P. Manimaran)
印度古吉拉特邦甘地纳加尔甘地纳加尔理工学院(Indian Institute of Technology Gandhinagar)生物科学与工程系,邮编382055
摘要 癌症仍然是一个重大的全球健康挑战,这凸显了寻找新型和有效治疗靶点的必要性。在这项研究中,我们构建了一个高置信度的癌症蛋白质-蛋白质相互作用网络,并选出了最大的连通分量,该分量包含2,564个与癌症相关的蛋白质,它们通过20,747个相互作用连接在一起。然后,我们评估了11种中心性指标来量化节点的重要性。利用TOPSIS多标准决策方法,我们对2,564个与癌症相关的基因进行了排名,并确定了前1%(26个基因)作为高优先级候选基因。药物-靶点映射显示,其中21个基因与已批准的药物、正在研究的药物或实验性药物相关,而NXF1、CDC5L、MOV10、EP300和CUL7这五个基因没有已知的治疗关联,因此被标记为未探索的靶点。GO和KEGG富集分析表明这些基因在转录调控、RNA加工、泛素介导的蛋白质降解以及Notch、JAK-STAT和mRNA监测等途径中发挥作用。这些过程的扰动越来越多地与癌症的发展和进展相关,突显了这些基因在癌症中的潜在作用。使用TCGA数据集对多种癌症类型进行的生存分析显示了显著的预后效应:CDC5L与急性髓系白血病的生存期延长有关(风险比(HR)= 0.59),EP300的表达与肾透明细胞癌的更好预后相关(HR = 0.52),而MOV10的表达升高则预示着肾透明细胞癌(HR=2.5)、肺腺癌(HR=1.5)和肝细胞癌(HR=1.5)的不良预后。CUL7的过表达与结肠腺癌(HR=2)和胶质母细胞瘤(HR=1.6)的不良预后相关。NXF1在不同癌症类型中表现出不同的结果,与宫颈癌的更好预后相关(HR=0.53),但在肾透明细胞癌中预后较差(HR=1.4)。这些发现提供了定量证据,支持了这些优先基因的生物学和临床相关性,而五个未针对的基因成为未来通过CRISPR干扰、基因沉默和功能表型检测进行实验验证的强大候选者。总体而言,这种综合的TOPSIS网络框架为发现已建立和新的治疗靶点提供了一种稳健且可重复的策略,扩展了精准肿瘤学的领域。
引言 癌症仍然是全球发病率和死亡率的主要原因之一。根据最新的GLOBOCAN估计,2023年全球约有2000万新发癌症病例和970万癌症相关死亡病例。在印度,癌症发病率正在迅速上升,2022年有146万新发癌症病例,预计到2025年将超过175万例(ICMR-NCDIR)。尽管精准肿瘤学取得了进展,但目前的治疗策略受到肿瘤异质性、治疗耐药性和复发的限制(Holohan等人,2013年)。虽然优先考虑已经确立的分子靶点是有价值的研究方向,但它可能阻碍创新并延迟新药的开发(Pushpakom等人,2018年)。这强调了系统地识别新的、生物学上相关的基因靶点以推进治疗发展和改善患者预后的必要性。在这项研究中,我们的主要目标是使用一个综合的计算机模拟框架来优先考虑与癌症相关的基因,该框架结合了多种网络中心性指标和TOPSIS多标准决策方法,从而能够系统地识别生物学上有意义且可能具有药物开发潜力的候选靶点。
复杂的生物系统可以通过蛋白质-蛋白质相互作用网络有效表示,其中节点代表蛋白质,边代表它们之间的相互作用。在这些网络中,拓扑和功能上重要的基因通常调节细胞存活、信号传导和疾病进展。中心性指标已成为表征网络中节点重要性的宝贵工具,已经开发了许多指标来捕捉蛋白质对网络结构和信息流的不同方面的影响(Ashtiani等人,2018年)。研究表明,具有高网络中心性的基因更有可能是必需的、与疾病相关的,并且具有治疗潜力,这使得基于中心性的优先排序成为靶点发现的有效方法(Fadhal等人,2014年)。
为了将这些异质性的中心性维度整合到一个统一的优先策略中,多标准决策(MCDM)框架受到了关注。其中,基于与理想解相似性的偏好顺序技术(TOPSIS)(Hwang & Yoon,1981年)非常适合生物医学应用,因为它允许同时评估多个独立特征,提供透明的排名逻辑,并适应生物学上不同的评分尺度。与其他MCDM方法相比,TOPSIS具有计算简单性、可解释性和对综合生物数据集的高适应性,使其成为基于生物学意义、治疗潜力和网络中心性进行大规模基因排名的合适选择(Mathebula和Mbuli,2025年;Tripathy等人,2022年)。
TOPSIS已成功应用于生物医学案例,包括癌症基因排名(M. Abd-ElFattah等人,2013年)、有影响力网络节点的优先排序(Du等人,2014年)、疾病分层(G.D. Praveenkumar和Sathishkumar,2016年)以及使用多组学数据进行的泛癌症功能分析(Xue等人,2023年)、基于距离的评估(Masmali等人,2024年)。这些研究共同增强了其支持生物决策的能力。然而,将基于网络中心性的TOPSIS框架应用于优先考虑未探索的癌症基因的应用仍然有限。
在本研究中,我们应用基于TOPSIS的优先框架,使用从PPI数据中得出的综合网络中心性属性对与癌症相关的基因进行排名。从得分最高的1%候选基因中,我们确定了五个目前缺乏已批准或研究性药物关联的基因——NXF1、CDC5L、MOV10、EP300和CUL7。尽管有证据表明这些基因与RNA代谢、染色质重塑和蛋白质调控机制有关,但它们作为药物靶点仍然未被充分探索,这表明它们可能是一类新的药物靶点。
通过结合系统的基因优先排序与药物可用性映射和下游的功能评估,这项工作旨在推进癌症生物学中的新靶点发现。除了优先考虑候选基因外,该框架还提供了一种可扩展且可重复的策略,适用于其他疾病背景。
材料与方法 我们从网络癌症基因(Network of Cancer Genes,NCG)版本7.2(
http://ncg.kcl.ac.uk/ )(Dressler等人,2022年)中检索了总共3,347个癌症驱动基因。为了构建蛋白质相互作用网络,我们从人类整合蛋白质-蛋白质相互作用参考(Human Integrated Protein–Protein Interaction rEference,HIPPIE)版本2.3(
http://cbdm.uni-mainz.de/hippie/ )(Alanis-Lobato等人,2017年)中获取了人类蛋白质-蛋白质相互作用数据,其中包含244,002个相互作用。我们仅选择了具有高置信度的相互作用。
结果 通过将多种中心性指标与TOPSIS多标准决策方法相结合,我们对蛋白质-蛋白质相互作用网络中的癌症相关基因进行了排名。排名列表中的前1%,即26个高得分基因,被选为后续研究对象。为了评估它们的治疗潜力,我们将这些基因映射到已建立的药物-靶点资源中,并将相应的药物分类为已批准的药物、正在研究的药物或实验性药物。
在26个基因中...
预测基因的功能富集分析 GO生物过程富集分析显示,优先考虑的基因与RNA调控、染色质修饰、蛋白质质量控制和细胞分化相关的功能主题显著相关(FDR < 0.05)(图5)。强烈富集的过程包括RNA聚合酶II介导的转录的正向调控、miRNA介导的mRNA沉默和RNA剪接相关事件,这突显了这些基因在转录后过程中的潜在作用。
KEGG通路富集 对优先考虑的基因进行的KEGG通路分析仅发现NXF1和EP300有显著富集(FDR < 0.05)(图8)。最富集的通路包括Notch信号传导、肾细胞癌信号传导、粘附连接调节、真核生物中的核糖体生物发生、流感介导的宿主调节和TGF-β信号传导。这些关联表明NXF1和EP300可能参与与肿瘤发生、进展、免疫调节、转移和治疗相关的过程。预测基因的生存分析 我们使用在线工具Survival Genie 2.0对几种癌症进行了生存分析,应用了Benjamini–Hochberg校正的多重假设检验,并将FDR调整后的p值< 0.05视为显著。每个优先考虑基因的风险比(HR)的详细信息见表4。
NFX1在肾透明细胞癌中的表达与生存结果显著相关,具有高...
讨论 近年来,癌症基因组数据集迅速扩展,但确定最相关的治疗靶点以改善治疗效果仍然是一个主要挑战。在这项研究中,我们使用了一种结合网络分析、药物可行性筛选、功能注释和生存分析的计算机模拟方法来缩小并优先考虑与癌症相关的基因。我们的结果突出了一组具有强烈生物学和临床相关性的基因,表明所提出的计算工作流程...
结论 总之,这项研究介绍了一个综合的计算机模拟框架,该框架结合了十一种网络衍生的中心性指标和药物-靶点景观评估,系统地优先考虑了包含2,564个蛋白质和20,747个相互作用的高置信度蛋白质-蛋白质相互作用网络中的癌症相关基因。使用TOPSIS多标准排名方法,我们将候选基因空间缩小到了26个排名最高的基因,其中五个基因(NXF1、CDC5L、MOV10、EP300和CUL7)目前...
数据和代码的可用性 本研究中使用的所有数据集均可从方法部分引用的来源公开获取。用于网络构建、中心性计算和基于TOPSIS的排名的自定义脚本可根据合理请求从相应作者处获得。
未引用的参考文献 (Bray等人,2024年;ICMR-NCDIR,2020年;M.Abd-ElFattah等人,2013年;Pelletier等人,2018年;Zdrazil等人,2023年)
资助 本研究未获得任何公共、商业或非营利性资助机构的特定资助。
CRediT作者贡献声明 尼莱什·巴布·图马迪(Neelesh Babu Thummadi): 撰写——审阅与编辑、可视化、验证、软件、研究、形式分析。P·马尼马拉兰(P Manimaran): 撰写——审阅与编辑、验证、监督、软件、方法论、研究、概念化。钱德拉莫汉·尼蒂亚(Chandramohan Nithya): 撰写——原始草稿、可视化、验证、软件、形式分析、数据管理。
竞争利益声明 作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文报告的工作。