编辑推荐:
为解决细胞游离 RNA(cfRNA)分析方法不足及临床应用难题,研究人员开展 cfRNA 片段信号检测研究。他们开发 cfPeak 方法,发现窄 cfRNA 峰的特性,且其可用于癌症检测等。该研究填补 cfRNA 分析空白,助力液体活检。
在生命科学的微观世界里,细胞游离 RNA(cfRNA)宛如神秘的信使,它们在生物流体中穿梭,携带着与疾病相关的重要信息,有望成为极具价值的疾病生物标志物。然而,想要精准地捕捉和解读这些信息,却困难重重。目前,cfRNA 的应用面临诸多挑战,传统分析方法难以全面探索其局部片段特征,容易遗漏低丰度或未注释区域的病理细胞来源片段,缺乏合适工具来识别和量化 cfRNA 片段信号,这极大地限制了相关科学研究的进展和临床应用的拓展 。
为了突破这些困境,清华大学的研究人员勇挑重担,开展了一项极具意义的研究。他们致力于开发一种新方法,更有效地检测 cfRNA 片段信号,并深入探究这些信号背后的生物学奥秘和临床价值。最终,他们成功开发出 cfPeak 这一创新方法,并取得了一系列令人瞩目的成果。该研究成果发表在《Genome Biology》杂志上,为 cfRNA 研究领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,通过收集包括转移性口腔鳞状细胞癌(OSCC)患者和健康供体等多种样本的血浆,提取其中的 cfRNA 进行测序 。其次,利用多种生物信息学工具,如 Piranha、CLIPper、CLAM 和新开发的 cfPeak 进行峰分析,并对不同方法的性能进行对比评估。此外,还运用了逻辑回归(LR)模型等机器学习算法对血浆样本进行分类,判断癌症状态。
下面让我们详细了解一下具体的研究结果:
- 窄峰在小 cfRNA-seq 数据中可重复检测:研究人员对比了细胞 CLIP-seq(CL-CLIP-seq)、细胞小 RNA-seq(CL-smRNA-seq)和细胞游离小 RNA-seq(CF-smRNA-seq)的读取覆盖图谱。发现 CF-smRNA-seq 中的峰具有更窄的峰范围、更多样的峰位置,且部分峰可重复检测并与注释区域重叠,暗示其潜在生物学意义。
- cfPeak 的概述及分析流程:鉴于传统峰值调用方法在分析小 cfRNA-seq 数据时存在的风险,研究人员开发了 cfPeak 方法。该方法包含六个步骤,具有诸多优势,并被整合到一个计算流程中,能够更有效地处理 cfRNA 数据。
- cfPeak 在公共和人工数据集上灵敏地发现峰:与其他方法相比,cfPeak 在识别已知转录本中的 cfRNA 峰时表现更优,能识别更多峰,包括一些低丰度且易被其他方法丢弃的峰。在不同数据集和多种评估指标下,cfPeak 都展现出良好的性能和通用性。
- cfPeak 能够识别已知和新转录本中的 cfRNA 峰:使用 cfPeak 研究已知转录本中的 cfRNA 峰时发现,其确定成熟 miRNA 边界的比例高于其他方法。同时,cfPeak 还能在先前未注释或新的转录本中找到 cfRNA 峰,有助于发现新的非编码 RNA(sncRNA)。
- cfRNA 峰受到蛋白质、囊泡和局部结构的反复保护:研究人员定义了转录组窗口保护分数(tWPS)来描述转录组区域的保护水平。发现 cfRNA 峰附近的 tWPS 曲线呈现相似模式,且峰区域与蛋白质结合(RBP)、细胞外囊泡分选(EV)、RNA G - 四链体结构(RGS)和 RNA 二级结构(RSS)等保护因子的结合位点重叠较多,表明 cfRNA 片段受到多种因素保护。
- 血浆中的 cfRNA 峰可用于癌症及癌症类型的判断:利用公共结直肠癌(CRC)血浆小 RNA-seq 队列进行研究发现,基于 cfRNA 峰的逻辑回归模型能有效区分 CRC 患者和正常对照,且组织来源的小片段可用于稳健的癌症检测。此外,血浆中的 cfRNA 峰还可用于推断原始组织中的 RBP 结合足迹,并区分不同癌症组织类型。
- 血浆中的 cfRNA 峰可用于判断癌症转移状态:通过对转移性 OSCC 患者血浆样本的研究发现,血浆中差异丰度的 cfRNA 峰能够清晰区分局部和转移性 OSCC 患者,且相关 KEGG 通路在转移性患者中显著富集,暗示 cfRNA 峰在非侵入性检测癌症转移状态方面具有潜力。
研究结论表明,cfPeak 是一种专为小 cfRNA-seq 峰分析设计的新计算方法,具有广泛适用性。它能够更好地识别反复保护的 cfRNA 峰,为 cfRNA 片段组学研究开辟了新道路。同时,研究突出了在临床队列中挽救低丰度峰的重要性,证明了这些 cfRNA 窄峰在液体活检中的临床潜力。
然而,该研究也存在一些局限性。例如,cfPeak 在映射 cfRNA 读取时对已知转录本更敏感;评估时仅纳入了三种代表性方法;转录组水平的期望最大化(EM)算法是从基因组版本改编而来,存在一定假设;研究主要聚焦于小 RNA-seq 中的短窄保护区域;仅考虑了四种 cfRNA 保护因素,部分注释需要进一步实验验证;临床样本中 cfRNA 的实际来源还需确认,cfPeak 在临床应用中的性能也有待在更大队列中进一步验证 。
尽管如此,这项研究仍然意义重大。它填补了当前小 cfRNA-seq 分析在片段尺度上的空白,为后续研究奠定了坚实基础。cfPeak 方法的开发为 cfRNA 研究提供了有力工具,有望推动液体活检技术的发展,在癌症早期检测、疾病诊断和病情监测等方面发挥重要作用,为人类健康事业带来新的希望。