
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于RESOLVE框架的20 000例成人及儿童肿瘤突变特征解析揭示癌症演化新机制
【字体: 大 中 小 】 时间:2025年07月11日 来源:Nucleic Acids Research 16.7
编辑推荐:
本研究针对癌症基因组学中突变特征分析的三大挑战(特征数量不确定性、病因不明、过拟合风险),开发了整合LASSO正则化与置信度评估的RESOLVE算法。通过分析20 000例成人及儿童肿瘤全基因组数据,首次证实少数主导性突变过程(如SBS1/5/3)驱动多数癌症演化,并建立突变特征-驱动基因-预后的多维关联(如SBS2-PIK3CA突变、SBS3-TP53突变的机制联系),为癌症分型与精准治疗提供新框架。
癌症作为基因疾病,其发生发展由体细胞突变驱动。这些突变形成的特定模式称为"突变特征",可揭示环境暴露和细胞内在过程对肿瘤的影响。然而当前突变特征分析面临三重困境:特征数量依赖经验性判断、部分特征病因不明、现有算法易受参考数据库选择的影响导致过拟合。这些问题阻碍了突变特征在临床分型和治疗中的应用。
为突破这些局限,米兰大学比可卡分校(University of Milano-Bicocca)的研究团队开发了RESOLVE(Robust EStimation Of mutational signatures Via rEgularization)计算框架,通过对20 000例成人及儿童肿瘤的全基因组测序(WGS)数据进行分析,首次系统揭示主导癌症演化的核心突变过程及其临床关联。该成果发表于《Nucleic Acids Research》。
研究采用四大关键技术:
RESOLVE框架的算法优势
通过800组模拟数据验证,RESOLVE在特征提取精度上显著优于现有工具(图2)。其核心创新在于同时对特征矩阵(S)和暴露矩阵(E)进行LASSO正则化,而SparseSignatures等工具仅正则化S矩阵。在真实肿瘤数据中,RESOLVE仅用29个SBS特征(对比COSMIC的79个)即实现更高拟合优度(成人样本平均余弦相似度0.992 vs 0.984),且97.2%样本拟合优度>0.95。

突变过程的全局图谱
基于k-medoids聚类发现:

机制新发现
本研究通过RESOLVE框架重新定义了癌症突变特征分析的标准:
该框架已封装为R包(Bioconductor/GitHub开源),其整合置信度评估与多维关联分析的能力,将推动突变特征从科研工具向临床决策标志物的转化。未来需在晚期肿瘤和多样化地域队列中验证发现的普适性。
生物通微信公众号
知名企业招聘