胰腺导管腺癌共识分子分类器的开发:整合肿瘤与基质特征的精准医疗新策略
《Genome Medicine》:Development of a consensus molecular classifier for pancreatic ductal adenocarcinoma
【字体:
大
中
小
】
时间:2025年11月16日
来源:Genome Medicine 11.2
编辑推荐:
本研究针对胰腺导管腺癌(PDAC)的高度异质性导致现有分子分类器一致性不足的问题,开发了整合肿瘤和基质特征的共识分子分类器PDAConsensus。通过分析514例PDAC样本的mRNA数据,结合机器学习优化,成功将肿瘤分为共识经典型(Consensus Classical)和共识非经典型(Consensus Non-classical),基质分为共识正常免疫型(Consensus Normal-immune)和共识活化ECM型(Consensus Activated-ECM),分类准确率达96.33%-98.92%。该研究不仅提供了可公开访问的R包PDACMOC和Shiny应用,更为PDAC的精准分型和个体化治疗提供了新框架。
胰腺导管腺癌(PDAC)作为胰腺最常见的恶性肿瘤,位居癌症相关死亡的第三位,其五年生存率仅为10%左右,堪称"癌王"之一。这种严峻的预后状况主要归因于肿瘤的高度异质性和独特的微环境特征。PDAC肿瘤拥有异常致密的基质成分,可占据肿瘤体积的90%,这种特殊的肿瘤微环境(TME)不仅阻碍化疗药物有效抵达肿瘤细胞,还创造了一个支持肿瘤生长、侵袭和治疗抵抗的微环境。
多年来,研究人员试图通过分子分类来解析PDAC的异质性。从Collisson等人首次提出经典型、准间质型和外分泌型的三分法,到Moffitt通过虚拟显微切割区分肿瘤和基质成分,再到Bailey、Puleo和Chan-Seng-Yue等团队不断细化的分类系统,PDAC的分子分类经历了显著演进。然而,这种分类系统的多样性也带来了新的挑战——不同分类系统之间的中度一致性、瘤内异质性以及处理方法差异,使得临床应用中难以达成统一标准。
面对这一困境,西班牙国家癌症研究中心(CNIO)的Pablo Villoslada-Blanco团队在《Genome Medicine》上发表了重要研究成果,他们开发了一种全新的共识分子分类器PDAConsensus,旨在整合现有分类系统的优势,同时纳入肿瘤和基质双重特征,为PDAC的精准医疗提供更可靠的分子分型工具。
研究团队整合了来自TCGA、ICGC和PanGenEU研究的514例PDAC样本的mRNA表达数据,通过批次校正、低表达基因过滤和方差稳定转换进行数据预处理。利用弹性网络正则化逻辑回归(Elastic-Net RLRC)对五个肿瘤分类系统(Collisson、Moffitt、Bailey、Puleo、Chan-Seng-Yue)和两个基质分类系统(Moffitt、Maurer)构建单样本分类器,随后采用马尔可夫聚类算法(MCL)识别共识类别。通过差异表达分析和基因集富集分析(GSEA)表征分子特征,最终使用随机森林(RF)构建具有42个基因(肿瘤)和60个基因(基质)的最终分类器,并在独立验证集中评估预后价值。
研究团队首先系统评估了多种机器学习算法在单样本分类任务中的表现。结果显示,弹性网络正则化逻辑回归(RLRC)在大多数分类器中表现最优,在肿瘤分类中的平衡准确度达到93.8%-98.4%,在基质分类中达到91.1%-98.9%。这一发现为后续共识分类器的开发奠定了技术基础。
通过对训练集中514例PDAC样本的分类,研究人员获得了各分类系统的亚型分布图谱。值得注意的是,不同分类系统之间存在显著的关联模式,如Collisson系统的经典型与Moffitt系统的经典型、Bailey系统的祖细胞型等倾向于共同出现,这提示了不同分类系统背后可能存在的生物学一致性。
通过马尔可夫聚类算法对肿瘤分类器进行共识聚类,研究团队成功识别出两个主要的肿瘤共识类别:第一类包含Collisson经典型、Moffitt经典型、Bailey祖细胞型等亚型;第二类包含Collisson准间质型(QM)、Moffitt基底样型、Bailey鳞状型等亚型。相应地,基质分类器也聚类为两个清晰的共识类别:Moffitt正常型和Maurer免疫富集型为一类,Moffitt活化型和MaurerECM富集型为另一类。
从196个核心样本(所有分配亚型均属于特定共识类的样本)中,研究人员进一步通过差异表达分析揭示了这些共识类别的分子特征。肿瘤共识类别的比较发现了1944个显著差异表达基因,基因集富集分析显示,角质形成细胞分化和细胞黏附相关基因在共识非经典型中富集。基于这些分子特征,研究团队将肿瘤共识类别重新命名为"共识经典型"和"共识非经典型",将基质共识类别命名为"共识正常免疫型"和"共识活化ECM型"。
研究团队通过严谨的特征选择过程,确定了最优的基因签名组合。对于肿瘤共识分类器,包含42个差异表达基因(21个在共识经典型中高表达,21个在共识非经典型中高表达)的随机森林模型在测试集上达到93.8%的平衡准确度。基质共识分类器则包含60个基因(各30个),实现了近乎完美的分类性能(100%平衡准确度)。
值得注意的是,肿瘤特征基因中有7个基因为本研究首次识别,包括B3GNT6、FEZF1、PRAP1等,单细胞RNA测序数据验证了这些基因的表达模式,证实了其生物学合理性。虽然GATA6这一经典标志物在特征选择中未被纳入最终分类器,但分析确认其在共识经典型样本中确实高表达。
研究发现肿瘤和基质共识分类之间存在显著关联(p=0.05)。具体而言,共识经典型肿瘤有59.6%的概率伴随共识正常免疫型基质,而共识非经典型肿瘤有50.4%的概率伴随共识活化ECM型基质。回归分析进一步揭示了非经典型评分(NonClassicalScore)与活化ECM评分(ActivatedECMScore)之间的正相关关系(y=0.21x+0.38,p<0.001),这表明肿瘤的非经典型特征与基质的活化状态存在内在的生物学联系。
在多变量Cox比例风险模型中,研究团队评估了共识分类器的预后价值。在TCGA和ICGC澳大利亚数据集中,共识非经典型肿瘤患者相比共识经典型患者死亡风险显著增高。尽管在其他数据集中这种关联未达到统计学显著性,但趋势一致。基质共识分类与生存的关联相对较弱,仅在ICGC加拿大数据集中发现共识活化ECM型患者生存期较短。这种异质性可能反映了不同数据集在肿瘤分期和患者管理方面的差异。
PDAConsensus共识分类器的开发代表了PDAC研究领域的重要进展。其创新性在于成功整合了多个现有分类系统,同时考虑了肿瘤和基质双重成分,并通过严谨的机器学习流程优化了分类性能。这一分类器不仅提供了更准确的预后分层工具,更重要的是为理解PDAC生物学异质性提供了新视角。
研究的实际应用价值通过开发的PDACMOC R包和用户友好的Shiny应用得以体现,这使得临床研究人员无需高性能计算资源即可对新的PDAC样本进行分类。这种可及性大大促进了该分类器在转化研究中的广泛应用。
值得注意的是,除了预后价值,共识亚型可能还具有治疗指导意义。既往研究表明,基底样亚型对吉西他滨更敏感,而对FOLFIRINOX方案敏感性较低。基于基质的共识分类可能进一步提供治疗机会:具有共识活化ECM表型的肿瘤可能受益于靶向TME的策略,而具有共识正常免疫表型的肿瘤可能更适合免疫治疗。尽管这些假设需要正式验证,但它们为亚型导向的治疗选择和临床试验中患者分层提供了理论依据。
研究的局限性包括对已有分类系统的依赖以及虚拟显微切割方法的选择,这些因素可能影响分类的准确性。未来工作需要前瞻性临床队列数据的进一步验证,以及与其他基于代谢、形态、剪接等特征的分类系统进行比较。整合单细胞RNA测序、空间转录组学等新技术将深化对PDAC异质性的理解,而通过液体活检等微创技术识别共识亚型将是临床转化的重要方向。
总之,PDAConsensus为PDAC研究提供了全面整合的分析框架,其双组分方法和可访问的计算工具为推进PDAC精准医疗奠定了坚实基础。通过促进更同质的患者分层和亚型特异性治疗开发,这一共识分类器有望最终改善PDAC患者的临床结局。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号