
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于分子数据整合的TCGA胶质瘤分类更新研究:遵循最新WHO指南的精准诊断策略
【字体: 大 中 小 】 时间:2025年06月05日 来源:Scientific Data 5.8
编辑推荐:
本研究针对TCGA数据库中胶质瘤样本分类与最新WHO指南脱节的问题,通过整合分子特征数据(IDH突变、1p/19q共缺失等),开发了Method-2016和Method-2021两种分类方法,分别实现98%和87%样本的精准重分类,为胶质瘤分子分型研究提供了标准化工具,推动精准诊疗发展。
胶质瘤作为中枢神经系统最常见的原发性恶性肿瘤,其分类标准随着分子生物学进展不断革新。2016年和2021年世界卫生组织(WHO)相继发布的新版指南,彻底改变了传统基于组织形态学的诊断模式,将IDH(异柠檬酸脱氢酶)突变、1p/19q染色体共缺失等分子特征纳入核心诊断标准。然而,作为重要研究资源的TCGA(癌症基因组图谱)数据库,其样本采集于2013年前,仍沿用旧版分类标准,导致大量"混合型胶质瘤"等过时诊断标签存在,严重制约现代研究的准确性。
为解决这一矛盾,来自葡萄牙里斯本大学、米尼奥大学等机构的研究团队Monica Leiria de Mendonca和Roberta Coletti等人,通过整合TCGA Pan-Glioma数据集与Ceccarelli研究组的多组学数据,开发出两套自动化分类流程Method-2016和Method-2021。研究成功对1110例样本进行重新注释,分别实现98%和87%的更新率,首次系统揭示了不同WHO标准下诊断标签的迁移规律(如41例2016版"星形细胞瘤"被2021版归类为"胶质母细胞瘤")。该成果发表于《Scientific Data》,为跨时代数据比较研究提供了方法论范式。
关键技术包括:1)从TCGA和GDC数据库获取1110例胶质瘤(515例LGG低级别胶质瘤+595例GBM)临床数据;2)整合Ceccarelli研究的IDH1/2突变、1p/19q共缺失、TERT启动子突变等分子特征;3)开发R语言算法实现WHO-2016/2021双标准自动化分类;4)通过UMAP降维等技术验证分类标签与分子特征的匹配度。
研究结果
方法学构建
Method-2016重点解决"混合型胶质瘤"的再分类问题,通过IDH和1p/19q状态将114/130例样本明确划分为星形细胞瘤(78例)或少突胶质细胞瘤(36例)。GBM样本则按IDH状态细分为野生型(423例)和突变型(35例)。
跨标准比较
Method-2021采用更彻底的分子驱动策略,最终将959例样本分为三组:IDHmut非共缺失型星形细胞瘤(282例)、IDHmut+1p/19q共缺失型少突胶质细胞瘤(171例)、IDHwt+特定遗传特征的GBM(506例)。交叉分析显示,41例2016版星形细胞瘤因符合IDHwt+TERT突变等标准被升级为GBM。
生物学验证
通过基因表达网络分析和多组学整合证实,新分类标签与分子亚型高度一致。例如IDHmut少突胶质细胞瘤显示独特的代谢通路激活,而IDHwt GBM呈现EGFR扩增特征,验证了WHO-2021分类的生物学合理性。
讨论与意义
该研究首次系统量化了WHO标准迭代对胶质瘤分类的影响:约12%病例因标准变化发生诊断类别迁移,凸显分子特征对预后的决定性作用。特别值得注意的是,33例传统GBM被重新归类为IDHmut 4级星形细胞瘤,这类患者可能受益于差异化治疗策略。
方法论层面,研究团队开源的R脚本(GitHub: sysbiomed/MONET)实现了三大创新:1)保留原始组织学信息的同时整合分子数据;2)兼容双WHO标准比较研究;3)模块化设计便于未来指南更新时的快速适配。对于临床转化而言,该工作为利用历史数据开展现代研究扫清了障碍,例如使TCGA这一宝贵资源能够继续服务于IDH抑制剂等靶向治疗研究。
局限性在于部分样本(13%)因缺乏EGFR扩增数据无法完成2021版分类,反映回顾性研究的普遍挑战。未来可通过单细胞测序等技术进一步细化分类,但本研究已为胶质瘤分子分型建立了可扩展的分析框架,推动神经肿瘤学进入"数据驱动诊断"的新时代。
生物通微信公众号
知名企业招聘