《Scientific Reports》:CKAP2, miR-941, miR-548 and LINC02577 as biomarkers for early diagnosis in colorectal cancer
编辑推荐:
本研究针对结直肠癌(CRC)早期诊断生物标志物缺乏的临床难题,通过整合生物信息学分析与实验验证,系统筛选并确认了CKAP2、LINC02577、miR-941和miR-548k作为新型诊断标志物。研究发现LINC02577的诊断效能(AUC=0.982)显著优于传统癌胚抗原(CEA),且其高表达与含亚叶酸化疗方案耐药相关(P=0.009),为CRC早期诊断和个体化治疗提供了新策略。
结直肠癌是全球范围内发病率和死亡率均位居前列的恶性肿瘤。据2022年全球癌症统计数据显示,当年新增病例约190万,死亡病例近90.4万例。在伊朗,2014-2017年间报告了约43,580例新发病例,预计到2025年病例数将上升至17,812例。更令人担忧的是,若能将结直肠癌的诊断从第四阶段提前至第三阶段,可使疾病特异性死亡率降低38%,相当于每10万人中减少11例死亡。这一数据凸显了早期诊断在改善患者预后方面的巨大潜力。
结直肠癌是一种具有高度异质性的恶性肿瘤,其发生发展涉及复杂的遗传和表观遗传改变。目前,一些分子标志物如KRAS、NRAS和BRAF突变已应用于临床实践,用于指导转移性结直肠癌的治疗决策。2009年,KRAS突变状态评估被纳入使用帕尼单抗和西妥昔单抗治疗的转移性结直肠癌患者的治疗决策流程,这使得结直肠癌成为第一个将分子检测作为治疗规划必需步骤的常见癌症。
近年来,非编码RNA(ncRNA)在癌症诊断和治疗中的价值日益凸显。微RNA(miRNA)如miR-92a和miR-21的过表达已显示出作为诊断生物标志物的显著潜力。长链非编码RNA(lncRNA)是长度超过200个核苷酸的非编码转录本,参与基因组组织、基因表达调控以及细胞分化、发育、应激反应和代谢调控等多种生物学过程。在癌症中,lncRNA可作为癌基因或抑癌基因,与细胞周期进程、凋亡抑制、血管生成和转移等癌症标志密切相关。
lncRNA与miRNA之间的相互作用直接关联到竞争性内源RNA(ceRNA)的概念。ceRNA通过竞争共享的miRNA来影响基因表达的调控。当lncRNA作为miRNA的"诱饵"时,它们阻止miRNA沉默其靶标mRNA,从而有效影响多个癌症相关通路。ceRNA活性通过改变基因表达平衡影响肿瘤生长、转移和细胞死亡抵抗等过程,因此在结直肠癌等多种癌症中具有重要意义。
尽管一些lncRNA已显示出作为非侵入性诊断生物标志物的前景,如PCA3于2012年被FDA批准用于前列腺癌的分子诊断,MALAT1被确定为口腔鳞状细胞癌的唾液生物标志物,但在结直肠癌领域,lncRNA的研究仍相对不足。近年来,随着下一代测序(NGS)技术的发展,探索ncRNA(包括lncRNA)的能力得到了革命性提升。这些技术使得lncRNA的发现和详细表征成为可能,为了解其在基因调控和细胞过程中的作用提供了见解。此外,NGS与多组学方法的整合促进了对lncRNA相关调控机制的全面理解。
机器学习(ML)在分析NGS产生的大量复杂数据方面发挥着关键作用。ML算法可以对lncRNA进行分类,预测它们与其他分子的相互作用,并识别与临床结果相关的模式。ML还整合多组学数据,揭示lncRNA如何融入更广泛的癌症调控网络,有助于识别治疗靶点。此外,ML基于lncRNA谱提高了结直肠癌亚型分类的准确性,有助于个性化治疗的实施。
尽管技术进步显著,但在结直肠癌中仍缺乏高效、可靠的早期诊断生物标志物。癌胚抗原(CEA)作为传统的结直肠癌生物标志物,其诊断性能有限,迫切需要发现新的生物标志物来提高早期诊断率。在此背景下,由Amirhosein Maharati和Mohammad javad Malekifar等人组成的研究团队在《Scientific Reports》上发表了他们的最新研究成果,通过整合生物信息学分析和实验验证,系统鉴定了一组具有早期诊断潜力的编码和非编码RNA生物标志物。
本研究主要采用了生物信息学分析、加权基因共表达网络分析(WGCNA)、功能富集分析、蛋白互作网络(PPI)构建、TCGA队列验证、受体操作特征曲线(ROC)分析、实时定量PCR(RT-qPCR)以及药物反应和生存分析等关键技术方法。研究人员从GEO数据库下载了GSE180440数据集(包含145个肿瘤样本和45个正常样本),并通过61对结直肠癌患者的组织样本进行实验验证。
3.1 原始数据预处理和DEGs/DELs识别
研究人员对GSE180440数据集进行了差异表达分析,共鉴定出672个差异表达基因(DEGs),其中包括差异表达的长链非编码RNA(lncRNA)和信使RNA(mRNA)。通过火山图、MA图和主成分分析(PCA)验证了分析结果的可靠性和样本分离效果。PCA分析清晰地将正常样本与肿瘤样本分离开来,表明基因表达谱具有明显的组间差异。
3.2 WGCNA分析和模块识别
基于差异表达分析结果,研究团队对23,767个基因进行了加权基因共表达网络分析(WGCNA),共识别出11个不同的基因共表达模块。通过分析模块与临床性状的关联,发现turquoise模块和blue模块与肿瘤状态、较高分期和微卫星稳定(MSS)状态显著相关,因此选择这两个模块进行后续分析。模块成员(MM)和基因显著性(GS)分析进一步验证了这些模块与结直肠癌特征的密切关系。
3.3 模块的功能富集分析
对turquoise模块进行基因本体(GO)富集分析、京都基因与基因组百科全书(KEGG)通路分析和基因集富集分析(GSEA)。结果显示,在生物过程(BP)中,染色体分离、核糖体生物发生、核糖核蛋白复合物生物发生和染色体组织最为富集;在细胞成分(CC)中,浓缩染色体、染色体区域和着丝粒区域最为富集;在分子功能(MF)中,作用于DNA的催化活性、DNA解旋酶活性和单链DNA结合最为富集。KEGG通路分析表明,DNA复制、真核生物中的核糖体生物发生和细胞周期是与turquoise模块相关的顶级通路。
3.4 基因选择和网络分析
通过取WGCNA的turquoise模块基因与差异表达基因的交集,研究人员确定了289个枢纽基因,包括156个lncRNA和133个mRNA。结合文献检索,最终选择了LINC00294、LINC02577和CKAP2作为候选基因。基于CKAP2构建了蛋白互作网络,并通过miRNet数据库构建了miRNA-基因互作网络,确定了miR-548k和miR-941作为关键的候选miRNA。
3.5 编码和非编码基因的RT-PCR分析
研究团队收集了61例结直肠癌患者的配对样本(30例男性和31例女性),年龄范围29-79岁(平均56±13岁)。大多数肿瘤组织为II级(50.8%)、T3/4浸润深度(75.4%)和N0/N1淋巴结受累(91.8%)。表达分析显示,CKAP2和LINC02577在病例中表现出更强的上调趋势,而LINC00294、miR-941和miR-548k则表现出不同的失调模式。
3.6 基因与临床病理特征之间的关联
CKAP2在大于5厘米的肿瘤中显著上调(P=0.025,AUC=0.667),表明其在肿瘤生长中可能发挥重要作用。LINC02577在女性晚期肿瘤中下调(P=0.028,AUC=0.264),但在淋巴结阳性女性病例中过表达(P=0.028,AUC=0.736),表明其具有肿瘤抑制作用。LINC00294与LINC02577显著共表达(P=0.03),且与miR-941过表达正相关(P=0.022)。miR-941在较大肿瘤中下调(P=0.018,AUC=0.342),但在浸润较深的女性患者中上调(P=0.043,AUC=0.647)。miR-548k表现出致癌行为,其过表达与早期肿瘤浸润增加(P=0.044,AUC=0.667)、晚期肿瘤体积较大(P=0.040,AUC=0.51)以及T1/T2肿瘤淋巴结受累(P=0.033,AUC=0.547)相关。
3.7 TCGA队列验证和AUC计算
在TCGA-COAD数据集(481个肿瘤组织和41个正常组织)中,CKAP2(log2FC=1.501,P<0.001)和LINC02577(log2FC=6.676,P<0.001)在肿瘤组织中显著上调,而LINC00294显著下调(log2FC=-1.104,P<0.001)。诊断性能评估显示,LINC02577的AUC为0.982,CKAP2为0.797,均显著优于CEA的0.663,而LINC00294的诊断能力较差(AUC=0.055)。
3.8 生存分析和药物反应评估
药物反应分析显示,LINC02577表达与含亚叶酸方案的FOLFOX regimen治疗后疾病进展显著相关(P=0.009),表明其可能作为化疗前的预测生物标志物。生存分析显示,所选基因均未表现出显著的预后价值。
本研究通过系统性的生物信息学分析和实验验证,成功鉴定了一组在结直肠癌中具有潜在诊断价值的编码和非编码RNA生物标志物。特别是LINC02577表现出卓越的诊断性能(AUC=0.982),显著优于传统的CEA标志物,且其高表达与含亚叶酸化疗方案的耐药性相关,这为结直肠癌的早期诊断和个体化治疗提供了新的思路。
CKAP2作为一种细胞骨架相关蛋白,在较大肿瘤中显著上调,表明其在肿瘤生长中可能发挥重要作用。功能富集分析显示,其所在模块与染色体分离、DNA复制等核过程密切相关,提示CKAP2及其共表达的lncRNA可能通过调控细胞周期进程参与结直肠癌的发生发展。
miR-548k和miR-941表现出复杂的调控模式,在不同临床背景下可能发挥双重作用,这反映了癌症中miRNA功能的语境依赖性。它们的表达特征与早期肿瘤进展参数相关,表明它们可能作为早期疾病进展的预测指标。
研究的创新之处在于整合了编码基因、长链非编码RNA和微RNA,从ceRNA网络的角度揭示了结直肠癌中可能存在的新的调控轴。此外,研究不仅评估了这些标志物的诊断价值,还探索了它们与临床病理特征和治疗反应的关系,为这些生物标志物的临床转化提供了更全面的证据基础。
然而,本研究也存在一定局限性,如样本量相对较小,可能影响结果的普适性。未来研究需要在更大队列中验证这些生物标志物的表达,并在血清或血浆样本中评估其临床相关性。此外,需要通过免疫组化和Western blot等技术在蛋白水平进行验证,以支持转录组学的发现。虽然研究结果提示了结直肠癌中可能存在新的lncRNA-miRNA-蛋白质调控轴,但确凿的证据还需要功能研究来提供。未来的研究应进行荧光素酶报告实验验证直接靶向关系,通过RNA免疫沉淀(RIP)检测体内RNP复合物,并通过RNA pull-down实验鉴定相互作用蛋白,共同确认这些相互作用并阐明观察到的效应的分子机制。
总的来说,这项研究为结直肠癌的早期诊断提供了有前景的新型生物标志物,特别是LINC02577和CKAP2显示出优异的诊断性能。这些发现不仅增进了我们对结直肠癌分子机制的理解,也为开发新的诊断方法和治疗策略奠定了基础,具有重要的临床转化潜力。随着进一步的功能验证和临床研究,这些生物标志物有望在未来结直肠癌的精准医疗中发挥重要作用。