
-
生物通官微
陪你抓住生命科技
跳动的脉搏
整合多细胞死亡模式的泛癌生物标志物与治疗靶点发现框架
【字体: 大 中 小 】 时间:2025年09月20日 来源:Frontiers in Bioinformatics 3.9
编辑推荐:
本综述构建了一个整合25种调控性细胞死亡(RCD)形式的多组学模型,通过整合TCGA和GTEx数据库的多组学数据,系统鉴定出44,641个具有转化潜力的多组学RCD特征。该研究利用基因组范围内的显著关联分析,揭示了不同RCD通路间的交互作用(multi-optosis),并开发了交互式分析平台CancerRCDShiny,为精准肿瘤学和免疫治疗提供新的生物标志物和靶点发现策略。
引言:调控性细胞死亡的研究背景与意义
调控性细胞死亡(RCD)在组织稳态和癌症进展中发挥重要作用,影响多种肿瘤类型的治疗反应。尽管单一RCD形式已被广泛研究,但缺乏整合多种RCD过程的综合框架,限制了系统性生物标志物的发现。为此,研究团队开发了一个包含25种不同RCD形式的多细胞死亡模型,整合了33种癌症类型的多组学和表型数据。
材料与方法:多细胞死亡模型的具体构建
研究整合了25种RCD形式,包括凋亡(apoptosis)、坏死性凋亡(necroptosis)、焦亡(pyroptosis)、铁死亡(ferroptosis)、自噬(autophagy)、铜死亡(cuproptosis)等。通过NCBI Gene数据库的布尔查询方法,编制了包含5,913个基因的多细胞死亡清单。利用TCGA Pan-Cancer和GTEx数据库的9,385个肿瘤样本和7,429个非肿瘤样本,分析了5,913个RCD相关基因,涵盖62,090个转录本异构体、882个成熟miRNA和239个癌症相关蛋白。
七种组学特征(蛋白表达、突变、拷贝数变异、miRNA表达、转录本异构体表达、mRNA表达和CpG甲基化)与七种临床表型特征(肿瘤突变负荷TMB、微卫星不稳定性MSI、肿瘤干细胞性指标、风险比背景、预后生存指标、肿瘤微环境背景和肿瘤免疫浸润背景)进行了相关性分析。研究共进行了超过2700万对配对相关性分析,产生了44,641个多组学RCD特征。
签名构建采用单组学、多表型框架设计,每个签名仅由一个组学层的特征元素组成。签名根据与表型特征的关联方向、肿瘤与非肿瘤组织表达极性以及HRC、SMC、TMC和TIC分类代码的一致性进行构建。签名命名采用十一组件结构:CTAB-GSI.GFC.PFC.SCS.TNC.HRC.SMC.TMC.TIC.RCD,确保数据组织和检索的高精度和清晰度。
结果:多组学特征的发现与分析
研究发现5,913个目标基因中的5,777个(97.7%)达到显著相关性,被纳入签名数据库。大多数签名包含至少一个凋亡相关基因(34,500;77.2%),这与81.4%的目标基因与凋亡相关一致。转录本异构体签名中最常见的基因包括EFEMP2、ABI3BP、TPM1等,这些基因与anoikis、凋亡、自噬、细胞衰老、坏死和焦亡相关。
研究发现30,877个签名具有RCD多模块参与,其中大多数显示多组学与表型特征之间的负相关(n=17,069),且多数在多肿瘤组织中过表达(n=13,898)。此外,识别出13,764个(30.83%)RCD特异性签名,其中凋亡特异性签名最为普遍(n=5,793;42%)。
mRNA特异性签名共10,096个(22.6%),其中7,278个(72.1%)显示与表型特征负相关,6,842个(94.1%)与TSM相关。这些签名中,3,864个(38.3%)与抗肿瘤转录谱相关,2,101个(20.8%)与促肿瘤谱相关,2,750个(27.2%)与双重微环境谱相关。根据与免疫细胞浸润谱的相关性,这些签名被分类为"热"(n=273;2.7%)、"冷"(n=781;7.7%)或"可变"(n=1,540;15.2%)。
转录本水平分析揭示了16,244个转录本特异性签名,其中62.8%(n=10,207)与至少一个生存指标的风险或保护相关。研究发现605个(5.9%)签名在所有患者生存指标中与风险相关,270个(2.7%)签名在所有四个患者生存指标中具有保护性关联。
研究发现多转录本基因中的相关性是转录本异构体特异性的,而不是涉及整个基因位点转录本库。例如,MAPK10基因有192个已知转录本,其中仅24个转录本在17种癌症类型中与TSM、TMB或MSI等指标显示显著相关性。
miRNA特异性签名共1,470个,其中954个(64.9%)包含单个miRNA元素。这些签名中,786个(53.5%)与至少一个生存指标的风险或保护相关。研究发现hsa-miR-142-3p在头颈部鳞状细胞癌(HNSC)患者中与TSM呈正相关,且在HNSC肿瘤中过表达。
基因特异性CpG甲基化签名共6,109个,其中4,246个(69.5%)包含单个CpG甲基化特异性成员。大多数(n=5,350;87.6%)与TSM相关。蛋白特异性签名共258个,其中254个(98.5%)与TSM相关。突变特异性签名共8,022个,其中5,464个(68.1%)由单个元素组成。大多数显示与TMB(5,880;73.3%)和MSI(2,136;26.6%)正相关。CNV特异性签名共2,442个,其中1,313个(53.8%)与TSM相关。
讨论:研究意义与临床应用价值
多细胞死亡模型是整合性和整体性的,查询了与RCD相关的5,913个基因,涵盖25种不同RCD形式的62,090个转录本、882个成熟miRNA和239个癌症相关蛋白和蛋白修饰(193个基因)。该模型假设RCD基因组件在不同癌症类型中的活性和效果存在非均匀性,每个癌症类型都单独分析,确保充分考虑每个癌症类型的独特生物学背景和特定分子机制。
签名数据库通过多个RCD信号通路为推进癌症研究和治疗提供了宝贵资源。签名标识符在命名系统中富含有意义的信息,揭示了多组学与表型特征之间隐藏的相关性。排名评分系统整合了多个关键因素来评估每个签名的整体显著性和相关性,为其预后价值提供了初步证据。
研究发现多组学与表型相关性之间的正相关和负相关都为理解癌症表型的签名提供了重要见解。正相关可能表示侵袭性癌症表型,而负相关可能指示抑制侵袭性特征或耐药机制的基因。识别与侵袭性肿瘤特征负相关的基因可以突出潜在的肿瘤抑制因子或较少侵袭性疾病的生物标志物。
转录本水平的相关性强调了在癌症研究和临床应用中区分特定异构体的重要性。虽然MAPK10作为一个基因位点在癌症类型中显示变异性,但个体转录本揭示了与表型特征和患者结局的独特关联。这种特异性表明异构体水平的分辨率有潜力完善预后工具和治疗策略。
签名数据库在临床前环境中的实际应用显示出巨大潜力,为患者分层、个性化治疗计划、预后应用和治疗决策提供了宝贵工具。这些签名可能使基于分子谱的患者分类成为可能,从而带来更定制化和有效的治疗策略。
研究发现148个基因签名具有与TMB正相关的体细胞突变,并通过与14种癌症类型的免疫浸润谱关联具有免疫治疗潜力。这些基因中的突变可能是新抗原的来源,因为高TMB会产生更多免疫原性突变。这种联系表明突变特异性签名可以识别用于个性化治疗的新抗原靶点,例如癌症疫苗或基于T细胞的治疗。
研究还发现了879个多组学签名,包含来自27个基因中至少一个基因成员,这些基因的蛋白质产品被分类为嵌合抗原受体(CAR)靶点,目前正在Clinicaltrials.gov确定的临床试验中进行研究。
局限性:研究的不足之处
本研究存在一些不足之处,在选择有影响力的签名时应予以考虑。首先,基因清单是一项持续的工作,这意味着各种研究中报告的一些基因可能被遗漏,因为我们的目录主要基于NCBI Gene数据库。尽管进行了交叉引用,但依赖单一数据库意味着该目录可能无法全面包括文献中报道的与RCD形式相关的所有基因。
其次,使用严格的基因组范围显著性阈值(padj值<5×10-8)在最小化假阳性的同时可能会降低灵敏度,特别是在较小数据集或信噪比较低的数据集中。用户在其数据集和研究设计的特定背景下应用此阈值时应予以考虑。在特定场景中,较不严格的阈值可能会增强灵敏度,而在较大数据集中保持严格阈值对于控制错误发现率至关重要。我们已公开源代码,使研究人员能够微调显著性阈值。
第三,本研究中识别的签名与原发性肿瘤样本相关。因此,这些签名在复发性肿瘤、转移性肿瘤和原发性血液癌症中的影响值未在本研究中涉及。未来研究应将这些分析扩展到其他肿瘤类型,以更全面地了解签名在不同癌症阶段和背景下的作用。
第四,PDF语料库仅包含免费访问的全文文件。这种限制可能导致数据集偏差,因为一些在订阅期刊上发表的相关研究未包括在内。交叉引用基因靶点和签名基因组件可能会错过那些受限访问出版物中可用的关键信息。未来研究应纳入更广泛的手工精选来源,以确保更高的准确性和深度。
最后,尽管本研究识别了具有潜在免疫治疗应用的生物标志物,但未纳入AI驱动的药物发现或分子对接方法来识别或验证治疗化合物。此类方法可以完善我们筛选针对RCD相关通路的特定抑制剂或激活剂的能力,并增强我们发现的转化相关性。未来研究应旨在将AI和基于对接的平台整合到CancerRCDShiny工具中,以支持发现针对本研究中识别的多组学签名的新药物。
优势:研究的创新与价值
本研究提供了癌症中25种RCD形式的全面分析,整合了七个组学层以识别具有生物学基础和临床相关性的签名。实施了结构化评分系统以评估签名显著性,并得到基于PDF-AI的文献挖掘策略的支持,进行基于证据的验证。多细胞死亡框架有意设计为保留多组学癌症数据固有的生物学和表型异质性,而不是将超过44,000个多层签名减少为元签名。这种方法能够跨组学层、表型属性和肿瘤类型进行上下文特定的 interrogation。
通过系统整合多种癌症的RCD形式与表型和生存特征,该模型为生物标志物发现和治疗靶点优先次序建立了一个结构化和可重复的平台。采用独特的签名命名法和交互式Shiny应用程序(CancerRCDShiny)的实施进一步将该资源与通用Pan-Cancer研究区分开来,提供生物学上连贯和临床可解释的输出。
结论:研究总结与未来展望
本研究引入了多细胞死亡框架作为一种新颖的整合方法,用于研究癌症中的RCD机制。通过纳入25种不同的RCD形式,该模型超越了传统的单一路径分析,提供了对RCD通路间复杂交互作用的整体视角。该框架不仅增进了我们对癌症进展和治疗抵抗的理解,同时为识别基因组范围的生物标志物和可操作的治疗靶点提供了一个强大平台。值得注意的是,多细胞死亡模型为临床应用奠定了基础,例如基于RCD相关表型对患者进行分层,以及设计针对多个RCD通路的疗法以提高疗效。
我们开发了一个富含系统命名法的签名数据库,揭示了多组学与表型特征之间隐藏的相关性。我们的排名方法通过整合生存指标和肿瘤免疫浸润谱,确保了对签名相关性的平衡和全面评估。这种优先排序加速了可操作见解的发现,并支持开发个性化治疗策略以改善患者结局。
用户友好工具如CancerRCDShiny和Cancer Regulated Cell Death Data Analyst促进了我们发现的实际应用。这些工具使研究人员和临床医生能够有效探索RCD多组学签名,利用动态可视化和可定制报告功能增强数据解释。
通过解决癌症生物学的复杂性和异质性,多细胞死亡框架提供了对RCD基因在癌症进展和抵抗中关联的详细理解。这种整合方法为识别候选生物标志物和治疗靶点铺平了道路,推动更有效的癌症治疗发展。
总之,多细胞死亡模型及其相关工具代表了癌症生物标志物发现和转化研究的重大进展,为个性化癌症治疗和改进临床结局提供了宝贵资源。
生物通微信公众号
知名企业招聘