
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多模态聚类揭示结直肠癌生存分析中的无事件患者亚群:迈向精准医疗的新突破
【字体: 大 中 小 】 时间:2025年08月04日 来源:npj Systems Biology and Applications 3.5
编辑推荐:
本研究针对结直肠癌(CRC)分子分型与预后评估的临床挑战,通过整合基因表达、DNA甲基化、miRNA和蛋白质组等多组学数据,结合全切片图像分析,首次发现传统单组学方法无法识别的"无事件生存亚群"。研究人员采用靶向特征选择和无监督聚类技术,在TCGA队列中鉴定出具有显著差异生存特征的亚群,并通过ANOVA和GSEA分析揭示该亚群与未折叠蛋白反应(UPR)、上皮间质转化(EMT)等关键通路的相关性。该研究为CRC精准分型提供了多模态整合新范式,其成果发表于《npj Systems Biology and Applications》。
结直肠癌作为全球第三大常见恶性肿瘤,每年导致约9%的癌症相关死亡。尽管共识分子亚型(CMS)分类系统基于基因表达数据将CRC分为4种亚型,但其在预后预测方面存在明显局限——既无法识别具有特殊生存模式的患者亚群,也难以解释肿瘤异质性带来的临床差异。更棘手的是,既往研究表明单纯增加组学数据维度反而可能因噪声干扰降低预测效能。这些矛盾现象促使科学家思考:如何通过优化多组学整合策略,挖掘出真正具有临床价值的分子特征?
瑞士国家科学基金会支持的科研团队在《npj Systems Biology and Applications》发表创新性研究。该团队突破性地采用"文献引导的特征选择"策略,从基因表达(40个CMS相关基因)、DNA甲基化(82个预后相关CpG位点)、miRNA(30个转移相关标记)和蛋白质组(11个差异表达蛋白)四个维度构建特征矩阵,并创新性地整合全切片图像(ViT提取的768维嵌入特征)。通过K-means++聚类算法,研究人员在TCGA COADREAD队列中首次发现传统CMS分类无法识别的"无事件生存亚群"——该亚群患者在随访期内均未出现疾病相关死亡事件。
关键技术方法包括:1)基于文献挖掘的靶向特征选择,从各分子层面筛选CRC相关标记;2)Vision Transformer处理全切片图像生成特征嵌入;3)K-means++无监督聚类结合肘部法则确定最佳簇数;4)采用Peto加权对数秩检验评估生存差异;5)通过ANOVA和GSEA解析关键分子特征。研究队列包含TCGA和CPTAC两个独立数据集,其中TCGA数据涵盖383例原发性肿瘤样本。
多组学特征识别生存亚群
通过整合四种组学数据,研究识别出四个具有显著生存差异的亚群(K=4)。其中Cluster 3在纯组学分析中表现为"无事件生存组"(10年生存率100%),与其余三个亚群存在统计学显著差异(p<0.005)。引人注目的是,该亚群在CMS分类中主要包含CMS1和CMS3型患者,而传统认为预后较好的CMS2型却完全缺席,提示多组学特征能捕捉CMS系统忽略的生物学异质性。
多模态数据提升预测效能
当加入全切片图像特征构建多模态模型时,Cluster 0取代Cluster 3成为新的"无事件生存组"。这种转变使组间生存差异的统计学显著性进一步提升(如Cluster 0 vs 1的p值从0.01降至<0.005),表明病理图像蕴含的形态学信息可补充分子特征的预测能力。稳定性分析显示,五次重复实验的聚类结果高度一致,证实方法的可靠性。
关键通路解析
ANOVA筛选出的差异特征通过GSEA揭示:无事件亚群显著富集于四个MSigDB Hallmark通路——未折叠蛋白反应(UPR, adjusted p=0.0405)、紫外线反应下调(adjusted p=0.0405)、上皮间质转化(EMT, adjusted p=0.0418)和G2-M检查点(adjusted p=0.0418)。其中UPR通路在CRC中的研究较为缺乏,该发现为探索内质网应激与CRC预后的关系提供了新方向。
临床与分子特征关联
临床病理分析证实,多组学特征可有效分层关键临床变量(如TNM分期、MSI状态等),且不受年龄、性别等混杂因素影响。特别值得注意的是,虽然CMS4型患者主要分布于预后不良亚群,但部分高微卫星不稳定性(MSI-H)的CMS1型患者却被划分至无事件组,暗示多组学模型能解析BRAF突变、KRAS突变和CIMP状态的复杂互作。
这项研究开创性地证明,基于知识驱动的多组学特征选择策略可有效克服"维度灾难",其识别出的无事件生存亚群为CRC精准医疗提供了重要参考——该亚群患者可能对现有治疗方案反应极佳,而针对EMT、G2-M检查点等特征通路的干预或可改善高危患者的预后。研究同时确立了全切片图像作为"视觉组学"数据的整合价值,为多模态肿瘤分析树立了新范式。未来研究可进一步探索自动化特征选择算法,并验证不同特征组合对分型效果的影响,推动CRC分子分型从实验室走向临床实践。
生物通微信公众号
知名企业招聘