基于转录组的儿童急性髓系白血病分子分型与预后分层新策略

【字体: 时间:2025年10月10日 来源:Annals of Hematology 2.4

编辑推荐:

  本研究针对儿童急性髓系白血病(AML)存在的生物学异质性和生存差异问题,通过整合公共数据集转录组数据,利用机器学习算法开发了新的预后预测模型。研究人员首次将AML重新分为8个分子亚型,发现各亚型在基因表达、免疫微环境、信号通路等方面存在显著差异,并鉴定出HSD17B10、NDUFS8等5个关键预后基因。XGBoost模型在预测中表现最佳(AUC=0.999),该研究为AML的精准分型和个体化治疗提供了新思路。

  
在儿童恶性肿瘤中,急性髓系白血病(Acute Myeloid Leukemia, AML)已成为白血病相关死亡的首要原因。尽管当前基于细胞遗传学和分子标记的风险分层系统已用于临床实践,但研究表明这些系统仍存在明显局限——约20%的儿科病例缺乏所有已知标志物,60%的病例缺乏可预测结局的标记。这种认知缺口导致相当比例本应属于高危的患者被错误划分到低中危组,造成治疗不足和预后不佳。更严峻的是,尽管80%患者经诱导化疗可获得完全缓解,但仍有40%会经历复发,这使得AML的总体生存率长期停滞在75%左右。生物学异质性强、靶向治疗开发缓慢、免疫治疗进展有限等因素共同制约着治疗效果的提升。
为突破这一困境,研究人员将目光投向转录组测序(RNA-Seq)技术。这项技术不仅能精确量化基因表达水平,还能检测mRNA层面的结构变异(如选择性剪切、融合基因),为疾病分型提供多维度信息。此前研究证实,通过大规模RNA-Seq数据分析可精确识别成人急性白血病的不同亚型,且这些亚型间存在显著生存差异。然而,儿童AML在突变谱、融合基因频率、表观遗传和转录特征等方面与成人存在本质区别,直接套用成人分类系统并不可行。因此,开展儿童AML的独立深入研究具有不可替代的价值。
本研究基于公共数据库(GDC Data Portal)的转录组表达谱和临床信息,对1767例儿童AML样本进行整合分析。通过严谨的质量控制流程(包括排除低质量样本、过滤低表达基因、去除重复样本等),最终确定1041例患者作为发现队列(Discovery Cohort),其中70%作为训练集(Train Cohort),30%作为测试集(Test Cohort),另726例作为独立验证队列(Validation Cohort)。研究人员首先从MSigDB数据库获取Hallmark、C2(KEGG)、C5(GO bp)三个基因集,通过基因集变异分析(GSVA)和Kaplan-Meier生存分析筛选出与总生存期(OS)显著相关的基因集;再与训练队列中经单变量Cox回归分析得到的预后相关基因取交集,最终得到143个OS相关特征基因。通过计算|HR-1|值对特征基因进行重要性排序,并采用LASSO回归和K-means聚类算法,以轮廓系数评估最佳聚类数,最终基于62个高预测价值特征基因将AML划分为8个稳定分子亚型(G1-G8)。
研究结果显示,这8个亚型展现出截然不同的临床结局:G1亚型预后最佳,5年生存率超过80%;而G8亚型预后最差,5年生存率低于40%。基因表达分析揭示,G3-G7亚型中HOXA家族基因(如HOXA9、HOXA10)和FLT3表达显著升高,而G8亚型呈现独特的内皮细胞相关基因表达特征。
免疫浸润分析显示各亚型微环境存在显著异质性:G5亚型富含B细胞、CD4+T细胞和CD8+T细胞;G7亚型则以M2型巨噬细胞和单核细胞浸润为主;G8亚型内皮细胞浸润程度最高。这些发现为不同亚型选择免疫治疗策略提供了理论依据——G5亚型或对免疫检查点抑制剂敏感,G7亚型需针对免疫抑制微环境采用CSF-1R抑制剂,G8亚型则可能从VEGF抑制剂中获益。
功能富集分析表明,各亚型激活的通路迥异:G1亚基因主要富集于RNA剪接过程;G3亚型主导翻译过程;G5亚型与淋巴细胞分化和SH2结构域介导的磷酸酪氨酸信号相关;G7亚型显著富集免疫应答通路;G8亚型则独特激活血小板活化通路。KEGG分析进一步提示G5、G7、G8亚型显著富集肿瘤微环境相关通路(如T细胞受体信号通路、B细胞受体信号通路、造血细胞谱系等)。
临床特征关联分析发现,预后较好的G1/G2亚型在传统风险分层中多被划分为低危组,且与良好核型重叠;而其他预后差异显著的亚型却集中在中危组,这揭示了现有分层系统对中危AML患者预后区分能力的不足。多因素Cox分析证实,分子亚型分类是OS的独立预测因素,其预测价值甚至超越某些传统细胞遗传学指标。
研究人员进一步采用四种机器学习算法(RF、SVM、DT、XGBoost)构建分子亚型预测模型。XGBoost模型表现出最优性能,在训练集和测试集中的宏观AUC分别达0.999和0.989。特征重要性分析揭示HSD17B10、NDUFS8、ASCL5、FADS2和COX8A是区分预后的关键因子,其中NDUFS8(线粒体复合物I亚基)和FADS2(脂肪酸去饱和酶)在AML中的预后价值已有报道,而HSD17B10(17-β羟类固醇脱氢酶)、ASCL5(神经发育转录因子)和COX8A(细胞色素C氧化酶亚基)作为新型AML预后标志物属首次报道。
模型在独立验证队列中表现出良好泛化能力,成功复现了八种分子亚型的表达和分化特征,且各亚型生存差异与发现队列一致。多变量Cox分析再次验证分子亚型分类对OS的独立预测价值。
该研究的创新性在于首次基于转录组数据将儿童AML系统划分为八个分子亚型,并深入解析了各亚型的分子景观、免疫网络和信号通路差异;开发的XGBoost预测模型展现出卓越的预后预测性能;鉴定出三个新型AML预后标志物(HSD17B10、ASCL5、COX8A)。这些发现不仅为理解AML异质性提供了新视角,更重要的是为实现个体化治疗和精准免疫治疗提供了理论依据。
然而研究也存在一定局限:回顾性设计可能高估模型性能;样本来源单一(主要来自COG-AAML1031试验);未进行系统共识聚类评估亚型稳定性;亚型间样本量不平衡可能影响分类效能;62基因模型未针对亚型区分性能进行优化。未来需通过前瞻性、多中心研究验证该分类系统的临床适用性,并深入探索关键基因的分子机制。
总体而言,这项发表于《Annals of Hematology》的研究为儿童AML的精准医疗提供了重要范式。通过整合多组学数据和机器学习算法,不仅深化了对疾病异质性的认识,更开辟了基于转录组特征进行风险分层和治疗决策的新途径,有望推动儿童AML治疗模式从传统化疗向精准靶向治疗的转变。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号