SEQENS 助力 AML 治疗结局预测:机器学习模型的创新突破

【字体: 时间:2025年05月02日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  急性髓系白血病(AML)治疗结局预测困难,研究人员开展基于 SEQENS 特征选择优化 AML 治疗结局预测模型的研究。结果显示,模型性能良好,能有效筛选特征。这为临床治疗决策提供支持,有助于改善 AML 患者管理。

  急性髓系白血病(AML)是一种较为棘手的血液系统恶性肿瘤,它如同隐藏在人体血液中的 “恶魔”,以多种分子改变导致造血干细胞恶性转化为特征。在美国,其 5 年相对生存率仅为 30.5% ;在欧洲,不同年龄段男性的 5 年相对生存率差异巨大,15 - 44 岁男性为 46.9%,而 65 - 74 岁男性却只有 7.5%。AML 的治疗目标是实现白血病的完全缓解(CR),但治疗过程充满挑战,治疗失败常源于初始耐药、未达 CR 以及缓解后的复发,同时治疗毒性也增加了患者死亡率 。因此,早期准确预估治疗反应对患者管理至关重要。
在这样的背景下,来自西班牙的研究人员积极探索,试图找到解决问题的办法。他们开展了一项极具意义的研究,旨在评估基于 SEQENS 算法的特征选择方法,并验证利用 AML 患者诊断时数据预测并发症风险的机器学习模型。研究成果发表在《BMC Medical Informatics and Decision Making》上,为 AML 的治疗带来了新的曙光。

研究人员采用了一系列关键技术方法。他们整合了西班牙 Hospital 12 de Octubre 和 Instituto de Investigación Sanitaria La Fe 两个中心的 568 例患者数据,这些数据涵盖了人口统计学、临床、遗传(VAF)和细胞遗传学等丰富信息。在数据处理上,运用 IQA 算法评估和处理缺失数据,通过设定多种标准进行数据筛选,如剔除有偏差、大量缺失值、准常量的变量等。特征选择方面,利用改进的 SEQENS 算法,结合多种归纳器并对目标变量随机洗牌,之后采用向后顺序特征搜索(BSFS)算法确定最优特征子集。模型构建则对比了 XGBoost、多层感知器(MLP)、逻辑回归(LR)和决策树(DT)这四种分类器 。

研究结果令人振奋。在相关特征方面,通过 SEQENS 算法发现不同预测时间点有不同的相关特征,其中 Age、TP53、?7/7q 和 EZH2 在所有时间点都具有相关性。在特征选择中,经 BSFS 算法筛选出不同场景下的特征子集。模型交叉验证显示,XGBoost 分类器在不同时间点和变量集上平均 ROC - AUC 值最高,如 90 天预测时,使用选定变量的 XGBoost 模型 ROC - AUC 达到 0.82(95% CI:0.78 - 0.85) 。外部测试里,针对 54 例患者的测试集,三个 XGBoost 模型预测并发症的 ROC - AUC 分别为 0.71(90 天)、0.77(6 个月)和 0.68(1 年) 。

研究结论和讨论部分意义重大。该研究确定了不同时间点 AML 患者并发症风险预测的相关特征,多数特征与 2022 欧洲白血病网(ELN2022)风险分类相符。XGBoost 模型在预测 AML 患者并发症风险方面表现出色,且使用选定变量能维持甚至提升模型性能,这意味着可以减少数据收集成本。虽然外部测试模型性能略有下降,但考虑到样本量小、数据收集差异等因素,仍具有一定前景。这一研究成果为临床医生管理 AML 患者提供了有力的决策支持工具,有助于根据患者风险制定个性化治疗方案和随访计划 。未来,研究人员计划收集更多数据扩大外部测试队列,探索基于生存分析的预测模型,聚焦人工智能可解释性,进一步推动 AML 治疗领域的发展,为更多患者带来希望。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号