《Cancer Medicine》:Integrative Transcriptomic Signature of tRNA-Derived Fragment Targets and Lactylation-Related Genes for Prostate Cancer Diagnosis
编辑推荐:
背景:传统诊断策略对前列腺癌(PCa)受到次优特异性的阻碍,常常导致过度诊断和不必要的侵入性活检。研究人员开发了一种基于tRNA衍生片段(tRFs)、靶基因和乳酰化相关基因(LRGs)的整合诊断框架,这两种新兴调控因子与PCa进展相关。方法:分析来自TCGA-
背景:传统诊断策略对前列腺癌(PCa)受到次优特异性的阻碍,常常导致过度诊断和不必要的侵入性活检。研究人员开发了一种基于tRNA衍生片段(tRFs)、靶基因和乳酰化相关基因(LRGs)的整合诊断框架,这两种新兴调控因子与PCa进展相关。方法:分析来自TCGA-PCa(499例肿瘤,52例正常组织)和五个独立GEO队列的批量RNA-seq数据。使用edgeR识别差异表达基因(DEGs),随后评估功能富集。通过将DEGs与预测的tRFs靶点及整理的LRGs取交集获得候选标志物。训练最小绝对收缩和选择算子(LASSO)模型,并在外部队列中验证。在30例前列腺组织样本中进行RT-qPCR临床确认。结果:DEGs、tRF靶点和LRGs之间有11个基因重叠,建立了七基因诊断特征(CSRP1、HMGN4、CALM1、NEFL、MSN、MKI67、ARID3A)。该模型在所有验证数据集中表现稳健,AUC值为0.728–0.904,超过前列腺特异性抗原(PSA)检测。RT-qPCR支持五个特征基因在临床样本中的显著失调,特别是NEFL降低和MKI67升高。决策曲线分析(DCA)表明,在常用临床阈值下,该模型可将不必要的活检减少约30%。结论:这种整合模型结合了tRFs相关靶点和乳酰化相关特征,相比传统PSA检测展现出更优的PCa检测准确性。七基因特征提供了一种具有生物学依据、临床可应用的工具,以改善早期诊断,同时可能减少不必要的活检。
**论文解读文章:整合tRNA衍生片段靶点与乳酰化相关基因的转录组特征用于前列腺癌诊断**
### 研究背景与问题
前列腺癌(PCa)是男性最常见的恶性肿瘤之一,全球发病率存在显著地理差异,与筛查实践和生活方式相关。尽管早期诊断至关重要,但当前诊断方法,包括直肠指检(DRE)、前列腺特异性抗原(PSA)检测、影像学检查和活检,受限于特异性不足和高假阳性率,常导致过度诊断和不必要的侵入性活检。PSA检测的曲线下面积(AUC)通常仅为0.66–0.70,迫切需要更精确的分子生物标志物。近年研究揭示,tRNA衍生片段(tRFs)作为功能性小非编码RNA,可通过调控mRNA稳定性、染色质组织和蛋白质翻译参与PCa进展;乳酰化作为一种新型翻译后修饰(PTM),由高细胞内乳酸水平驱动,可动态调控染色质结构和基因可及性,与肿瘤免疫逃逸和代谢适应相关。然而,tRFs与乳酰化在PCa诊断中的协同作用尚未被探索。基于此,研究人员假设tRFs可能通过靶向乳酰化相关基因(LRGs)形成调控轴,并开发整合诊断模型。该研究发表在《Cancer Medicine》。
### 主要关键技术方法
1. **数据来源与差异表达分析**:从癌症基因组图谱(TCGA)PCa队列(499例肿瘤、52例正常)和五个独立基因表达综合数据库(GEO)队列(GSE237995、GSE62872、GSE70768、GSE72220、GSE79021)获取批量RNA-seq数据。使用edgeR软件包以|log
2倍数变化|>0.585和Benjamini–Hochberg校正q值<0.05为标准鉴定差异表达基因(DEGs)。
2. **tRFs靶基因预测与LRGs整理**:基于前期tRFs测序数据(GSE315385)中的五个tRFs(tiRNA-1_33-Gly-GCC-1等),利用TargetScan和miRanda算法预测高置信度mRNA靶点。从已发表文献中整理487个乳酰化相关基因(LRGs)。
3. **模型构建与验证**:通过Venn图取DEGs、tRF靶基因和LRGs的三者交集,获得11个候选基因。采用最小绝对收缩和选择算子(LASSO)回归进行特征选择(λ=0.0099,10折交叉验证),构建七基因诊断模型。受试者工作特征(ROC)曲线评估诊断效能,决策曲线分析(DCA)评估临床获益。
4. **实验验证**:收集2023年1月至2024年12月在扬州大学附属医院行穿刺或手术的30例前列腺组织样本,经伦理批准和知情同意,采用RT-qPCR检测关键基因表达,以GAPDH为内参,2
-ΔΔCt法计算相对表达量。
### 研究结果
**3.1 PCa诊断模型构建与验证的工作流程**:研究人员设计了整合转录组分析流程:通过TCGA和GEO数据库鉴定DEGs,进行功能富集分析;同时预测tRFs靶基因并整理LRGs;通过Venn分析选择候选基因,LASSO回归构建诊断模型;在五个独立队列中验证;最后经RT-qPCR实验验证关键基因表达模式。
**3.2 差异表达分析**:在TCGA-PCa队列中,共鉴定10,632个DEGs(5,379个上调,5,253个下调)。层次聚类分析和热图显示肿瘤与正常样本显著分离,关键DEGs如SPINK1、APOA2和SEMG1可作为有效区分标志。散点图和火山图表明表达变化与统计显著性的平衡分布,证实DEG可靠性。
**3.3 DEGs的GO富集分析**:DEGs在生物学过程(BP)中显著富集于细胞分化、黏附、迁移和代谢过程;在分子功能(MF)中富集于蛋白质结合、离子通道活性和受体介导相互作用;在细胞组分(CC)中富集于细胞外周、细胞外基质和细胞连接,提示其参与细胞间通讯和组织结构维持。
**3.4 DEGs的富集信号通路**:KEGG通路分析显示DEGs显著富集于神经活性配体-受体相互作用、钙信号和cAMP信号通路。其中,神经活性配体-受体相互作用通路富集最显著,与PCa神经内分泌分化及肾上腺素受体介导的治疗耐药一致;ADCY3、CALM1和CREB3L1等基因成为多个通路(尤其是cAMP级联)的中心节点,强调细胞通讯和代谢适应在PCa中的关键作用。
**3.5 候选枢纽基因的鉴定**:Venn图分析显示,DEGs、LRGs和tRF靶基因三者共有11个重叠基因(CSRP1、NEFL、CALD1、MSN、CALM1、LDHB、HMGN4、PFKP、MYH13、MKI67、ARID3A),这些基因在PCa中失调、受tRFs潜在调控且与乳酰化过程机制相关,被选为模型构建的高优先级候选。此外,DEGs与LRGs有27个重叠基因,LRGs与tRF靶基因有138个重叠基因。
**3.6 基于tRFs和乳酰化的整合诊断模型构建与验证**:LASSO回归从11个候选基因中选择7个最优诊断标志物(CSRP1、HMGN4、CALM1、NEFL、MSN、MKI67、ARID3A)。训练队列AUC=0.952,内部验证队列AUC=0.945,合并AUC=0.947。各基因贡献分析显示,MKI67(增殖标志物)和ARID3A(转录调控因子)是最强预测因子,系数分别为1.32和0.89;CSRP1和NEFL具有肿瘤抑制权重,支持模型的生物学合理性。
**3.7 外部验证确认模型强泛化能力**:在五个独立GEO队列中,模型AUC范围为0.728–0.904(GSE70768最高为0.904),均优于PSA检测的典型AUC(0.66–0.70),证实其稳健性和广泛适用性。决策曲线分析表明,在常用临床阈值下,该模型可减少约30%的不必要活检。
**3.8 RT-qPCR确认关键标志基因在前列腺癌组织中的差异表达**:在30例临床样本中,CSRP1、HMGN4和NEFL在肿瘤组织中显著下调(NEFL变化最显著,***p<0.001),ARID3A和MKI67显著上调(MKI67高度富集,***p<0.001)。CALM1和MSN在小组验证中差异不显著(p>0.05),说明多基因模型整体诊断能力优于单标志物。这些表达模式反映了肿瘤抑制功能减弱与增殖恶性特征增强的分子框架。
### 讨论与结论
**讨论总结**:研究整合tRFs介导的转录后调控与乳酰化相关的代谢重编程,建立了七基因诊断模型,其基因失调协同揭示tRFs与乳酰化之间的正反馈环路:tRFs调控钙稳态关键转录本稳定性,乳酰化响应代谢变化通过染色质重塑稳定恶性表型。各基因功能模块包括:增殖与干性(MKI67、ARID3A)、侵袭转移(CSRP1下调、MSN改变)、代谢信号(CALM1钙传感失调)、表观遗传界面(HMGN4降低)、微环境交互(NEFL反映神经周围浸润)。RT-qPCR验证支持生信预测。局限性包括依赖回顾性公共数据集、缺乏非侵入性样本验证、机制关系尚不明确,未来需多中心前瞻性试验和单细胞测序研究。
**研究结论**:本研究通过整合tRFs相关调控靶点与乳酰化相关基因特征,建立并验证了新型PCa转录组诊断框架。七基因组合(CSRP1、HMGN4、CALM1、NEFL、MSN、MKI67、ARID3A)在多个独立队列中展现稳健诊断性能,持续优于传统PSA检测。实验验证确认关键基因差异表达(CSRP1、HMGN4、NEFL下调;ARID3A、MKI67上调),强调其PCa进展的生物学相关性。尽管需进一步前瞻性和机制验证,这种整合方法代表了一种具有生物学依据且临床前景的策略,可改善早期PCa检测并减少不必要的侵入性操作。