线粒体非编码RNA作为肺癌治疗的新生物标志物和治疗靶点:传统生物信息学与机器学习方法的结合
《Frontiers in Oncology》:Mitochondrial non-coding RNAs as novel biomarkers and therapeutic targets in lung cancer integration of traditional bioinformatics and machine learning approaches
【字体:
大
中
小
】
时间:2025年10月31日
来源:Frontiers in Oncology 3.3
编辑推荐:
肺癌诊断中mtRNA作为新型生物标志物的研究,通过TCGA数据整合机器学习(随机森林、逻辑回归、SVM)筛选出10个差异表达的mtRNA,其中t00043332经细胞实验验证可促进增殖、迁移和抗凋亡。
肺癌是一种全球范围内致死率最高的癌症之一,每年导致约180万人死亡,占所有癌症死亡人数的近20%。尽管近年来在治疗手段和诊断技术方面取得了显著进展,但肺癌患者的五年生存率仍维持在15%至20%之间,主要原因在于疾病通常在晚期才被发现,此时治愈的可能性已大大降低。肺癌的异质性特征,包括其多种组织学亚型,如腺癌、鳞状细胞癌和小细胞肺癌,使得早期检测和治疗管理变得复杂。目前,低剂量计算机断层扫描(LDCT)等影像学方法已被证明在高危人群中具有降低死亡率的效果,但这些方法仍面临高昂的成本、有限的可及性、频繁的假阳性结果以及辐射暴露等挑战,限制了其作为大规模筛查工具的广泛应用。
因此,寻找成本效益高、侵入性小且准确性高的诊断生物标志物成为肺癌研究的迫切需求。近年来,液体活检技术的兴起为这一目标提供了新的思路,特别是在研究循环核酸方面。非编码小RNA(sncRNAs)因其在体液中的稳定性、组织特异性表达以及在癌症发生中的功能作用,被认为是具有潜力的生物标志物候选。尽管微小RNA(miRNAs)在多种癌症类型的诊断和预后研究中得到了广泛探索,但其他类型的sncRNAs,如小核仁RNA(snoRNAs)、PIWI相互作用RNA(piRNAs)和转移RNA衍生的小RNA(tsRNAs)也逐渐引起关注。然而,一个相对未被充分研究的类别——线粒体来源的小RNA(mtRNAs)——可能为肺癌诊断和治疗带来新的突破。
线粒体在细胞能量代谢、细胞凋亡调控和氧化应激反应中发挥着基础作用,而这些功能在癌症的发生和发展过程中往往受到破坏。人类线粒体基因组包含37个基因,其中13个编码蛋白质,22个编码转移RNA(tRNA),以及2个核糖体RNA(rRNA)。这些基因对于线粒体呼吸链的功能和ATP的合成至关重要。越来越多的研究表明,线粒体功能障碍,如代谢改变、活性氧(ROS)生成增加和呼吸链活性下降,是癌症病理生理学的标志性特征。此外,线粒体tRNA在特定的内切酶切割作用下,可以生成稳定的mtRNA片段,这些片段具有类似细胞质miRNA的表达模式和调控功能,可能在细胞应激反应和代谢调控中发挥重要作用。尽管已有研究表明mtRNA可能与多种细胞过程相关,但其在人类恶性肿瘤中的诊断价值仍处于初步探索阶段。
为了更全面地理解mtRNA在肺癌中的作用,本研究采用了一种结合传统生物信息学方法与先进机器学习技术的综合策略。通过分析TCGA数据库中肺腺癌(TCGA-LUAD)和肺鳞状细胞癌(TCGA-LUSC)的miRNA-seq数据,我们鉴定了mtRNA的表达特征,并利用差异表达分析筛选出在肿瘤组织与正常组织之间显著变化的mtRNA。研究中使用了严格的统计标准,即P值小于0.01且绝对log2倍数变化(|log2FC|)大于1,以确保结果的可靠性。通过主成分分析(PCA),我们观察到肿瘤样本与正常样本在mtRNA表达谱上形成了明显的聚类模式,表明mtRNA表达特征能够有效区分肿瘤与正常组织。
在机器学习分类分析中,我们比较了支持向量机(SVM)、随机森林(Random Forest)和逻辑回归(Logistic Regression)等算法的分类效果。结果显示,随机森林和逻辑回归算法在分类准确率方面表现优于SVM,其曲线下面积(AUC)均超过0.92,显示出极高的诊断潜力。其中,随机森林算法不仅在分类性能上表现出色,还能提供特征重要性排序,帮助我们识别出最具区分力的mtRNA。通过这一方法,我们筛选出了排名前十的mtRNA,其中t00043332的表达显著增强,显示出最高的重要性得分。这表明t00043332可能在线粒体RNA调控中扮演关键角色,并具有作为肺癌生物标志物的潜力。
为了进一步验证这些mtRNA的生物学功能,我们选择了t00043332进行体外实验。在A549和PC9两种肺癌细胞系中,我们通过过表达实验观察到t00043332对细胞增殖、迁移、侵袭和凋亡抵抗的显著促进作用。细胞增殖实验(CCK-8)显示,t00043332的过表达显著提高了两种细胞系的生长速率,且这种促进作用在96小时的实验周期内持续存在。克隆形成实验也支持了这一发现,结果显示过表达t00043332的细胞形成更多克隆,表明其具有增强细胞存活和增殖的能力。此外,伤口愈合实验表明,t00043332的过表达显著增加了细胞迁移能力,这可能与肿瘤的转移潜能有关。侵袭实验进一步证实了这一现象,显示t00043332的过表达显著提高了细胞通过Matrigel包被膜的能力,表明其在促进肿瘤侵袭和转移方面具有重要作用。
为了评估t00043332对细胞凋亡的影响,我们进行了流式细胞术分析。结果显示,t00043332的过表达显著降低了Annexin V阳性细胞的比例,表明其具有抑制细胞凋亡的能力。在A549细胞中,Annexin V阳性细胞的比例从约12%降至6%,而在PC9细胞中,这一比例从约4%降至3%。这些结果表明,t00043332可能通过干扰细胞凋亡通路,帮助癌细胞逃避程序性死亡,从而促进肿瘤的进展。这些功能特性不仅支持了mtRNA在癌症发生中的潜在作用,也为开发新的治疗策略提供了理论依据。
尽管我们的研究发现了多个具有诊断价值的mtRNA,但这些生物标志物与患者生存率之间的关联并不显著。这表明,虽然mtRNA在肺癌早期检测中可能具有重要价值,但它们在预测疾病进展和预后方面的作用仍需进一步研究。这种现象可能与不同分子机制驱动癌症的发生和进展有关,即诊断性生物标志物可能反映早期代谢重编程事件,而预后性标志物则更多与晚期基因和表观遗传变化相关。这一发现也与以往的研究一致,即某些生物标志物在早期检测中表现优异,但在预测疾病结局时效果有限。
在本研究中,我们采用的基于比率的归一化方法为解决sncRNA生物标志物研究中的技术挑战提供了新的思路。传统的归一化方法常因缺乏可靠的参考基因和对小RNA技术变异性的敏感性而面临困难。通过比率归一化,我们有效减少了样本处理条件、RNA提取效率和PCR扩增变异等因素对结果的影响,从而提高了生物标志物的可重复性和临床适用性。这一方法的成功应用,不仅为mtRNA研究提供了技术支持,也为其他sncRNA类别的生物标志物研究提供了借鉴。
本研究的另一个重要特点是将组织学生物标志物发现与功能验证相结合。虽然许多生物标志物研究仅限于统计学关联,但我们的研究通过体外实验验证了所选mtRNA的生物学功能,证明了其在肺癌发生中的潜在作用。这种整合方法不仅增强了研究结果的可信度,也为精准医学研究提供了新的方向,即通过理解生物标志物的分子机制,提高其在临床中的应用价值,并发现潜在的治疗靶点。
尽管本研究取得了重要进展,但仍存在一些局限性。首先,TCGA数据集的回顾性分析虽然提供了大量临床信息,但可能无法完全反映实际临床环境中生物标志物的性能。此外,研究主要集中在两种常见的肺癌亚型上,而肺癌的异质性意味着未来需要进一步研究其他亚型和不同疾病阶段的mtRNA表达特征。同时,目前对mtRNA功能机制的理解仍较为有限,未来的研究需要进一步探讨这些小RNA如何调控细胞过程,以及它们是否可以通过特定的靶向策略被用于治疗。
总的来说,本研究展示了线粒体非编码RNA在肺癌诊断和治疗中的巨大潜力。通过整合传统生物信息学方法与机器学习技术,我们不仅发现了具有诊断价值的mtRNA,还验证了其中一些RNA的生物学功能,为肺癌的早期检测和治疗策略提供了新的方向。这些发现不仅加深了我们对线粒体功能障碍在癌症中的作用的理解,也为未来研究线粒体RNA调控机制及其在其他癌症类型中的应用奠定了基础。随着对mtRNA功能的进一步揭示,其在癌症治疗中的应用前景将更加广阔。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号