编辑推荐:
本研究提出一种狄利克雷-多项式混合模型,用于分析肿瘤进化过程中克隆和亚克隆突变特征的差异丰度,揭示了多种癌症类型中突变特征的动态变化及其潜在机制,为癌症治疗提供新思路
癌症是一种复杂的基因组疾病,其发生和发展过程中,多种突变过程会在肿瘤基因组中留下独特的“突变特征”印记。这些突变特征反映了不同突变机制的活跃程度,对理解肿瘤进化和寻找治疗靶点至关重要。然而,目前对于这些突变特征在肿瘤克隆和亚克隆阶段的动态变化及其差异丰度的研究仍存在挑战。为此,国外研究团队提出了一种狄利克雷-多项式混合模型,通过分析23种癌症类型的全基因组数据,揭示了克隆和亚克隆突变特征在不同癌症类型中的差异丰度模式,以及这些差异背后可能的生物学机制。该研究不仅为深入理解肿瘤进化提供了新的视角,还为基于突变特征的癌症治疗策略开发提供了理论依据,研究成果发表在《BMC Bioinformatics》上。
在研究中,研究人员首先介绍了癌症基因组学背景,指出癌症细胞群体通过克隆扩张生长,肿瘤中存在多个克隆,即具有共同基因型的细胞群体。克隆突变是所有癌细胞共有的突变,而亚克隆突变仅出现在部分细胞中。突变特征作为突变过程的“指纹”,通过计算方法从全基因组测序数据中提取,能够反映突变过程的种类和强度。COSMIC数据库是目前突变特征的重要资源,其中包含了多种单碱基替换突变特征(SBS)。然而,随着突变特征数量的增加,其解释变得困难,且从统计学角度分析也面临挑战。
为了更好地理解肿瘤进化过程中突变特征的动态变化,研究人员以23种癌症类型、27个样本以上的PCAWG队列为研究对象,采用狄利克雷-多项式混合模型,考虑了样本内相关性、随机效应的多变量结构以及组特异性离散参数,能够灵活地扩展到多组比较或回归设置。通过模拟数据评估模型性能,结果表明该模型在参数估计的偏差和覆盖率方面表现出色,且在不同生物学相关参数下均具有良好的鲁棒性。与现有方法HiLDA和TCSM相比,该模型在检测差异丰度方面具有更高的真阳性率和更快的运行速度。
在PCAWG数据的应用中,研究人员首先对六种单核苷酸突变类型(C>A、C>G、C>T、T>A、T>C、T>G)进行分析,发现克隆和亚克隆突变在不同癌症类型中存在差异,且这种差异具有癌症类型特异性。例如,C>T是大多数癌症类型中最丰富的突变类型,而T>G是最不丰富的。进一步对突变特征暴露进行分析,结果显示所有癌症类型均存在差异丰度,且亚克隆突变的离散度高于克隆突变。通过分析患者随机截距,研究人员还发现了不同癌症类型中患者突变特征的异质性。
研究结果表明,不同癌症类型中克隆和亚克隆突变特征的差异丰度模式具有一定的规律性。例如,与年龄相关的时钟签名SBS1和SBS5在大多数癌症类型中表现出较好的一致性,而APOBEC签名SBS2和SBS13在某些癌症类型中存在差异。此外,研究人员还发现了一些突变特征与已知生物学过程的关联,如SBS3与HRD(同源重组缺陷)相关,SBS4与吸烟相关等。这些发现为深入理解肿瘤进化过程中突变特征的动态变化提供了重要线索。
在研究结论和讨论部分,研究人员强调了该研究的重要性。首先,该研究提出的狄利克雷-多项式混合模型为分析肿瘤进化过程中突变特征的差异丰度提供了一种新的统计方法,能够更好地处理样本内相关性和组间差异。其次,通过对23种癌症类型的数据分析,研究人员揭示了克隆和亚克隆突变特征的差异丰度模式及其潜在生物学机制,为癌症治疗提供了新的靶点和思路。例如,通过识别具有差异丰度的突变特征,可以为基于突变特征的癌症治疗策略开发提供理论依据。此外,该研究还为未来的研究提供了方向,如进一步验证这些差异丰度的生物学意义,以及将该模型应用于其他癌症队列和临床样本中,以探索更多与肿瘤进化相关的突变特征和机制。总之,这项研究不仅在理论上丰富了肿瘤进化和突变特征领域的研究,也为癌症的精准治疗提供了新的可能性。