《Cancer Medicine》:Development of an Artificial Intelligence Web Application for Predicting Chemotherapy-Induced Neutropenia in Patients With Non-Small Cell Lung Cancer: A Prospective Study
编辑推荐:
摘要
目的:本研究旨在开发一个用于预测非小细胞肺癌(NSCLC)患者化疗所致中性粒细胞减少症(CIN)的人工智能(AI)网络应用程序。
方法:研究人员开展了一项前瞻性研究,纳入了2019年至2024年间来自天津医科大学总医院的310名NSCLC患者,这
摘要
目的:本研究旨在开发一个用于预测非小细胞肺癌(NSCLC)患者化疗所致中性粒细胞减少症(CIN)的人工智能(AI)网络应用程序。
方法:研究人员开展了一项前瞻性研究,纳入了2019年至2024年间来自天津医科大学总医院的310名NSCLC患者,这些患者共接受了1047个化疗周期。收集了详细的临床信息和实验室数据。数据集在患者层面被随机分为训练集(80%)和测试集(20%)。采用机器学习方法构建模型。在训练集上通过交叉验证完成训练和超参数优化(HPO)后,通过测试集比较模型性能。同时,通过整合上述优化的基学习器,构建了一个堆叠集成模型。使用标准评估指标,如受试者工作特征曲线下面积(AUC)、准确率、召回率、精确率、F1分数和Brier分数,进行模型判别。为增强最优模型的透明度,研究人员将Shapley加法解释(SHAP)与局部可解释模型无关解释(LIME)及部分依赖图(PDP)技术结合使用。基于最佳的机器学习模型,在互联网上开发了一个AI应用程序。
结果:分类提升(CatBoost)模型的AUC为0.849(95% CI:0.788-0.905),准确率为0.813,召回率为0.814,特异度为0.813,F1分数为0.642,Brier分数为0.141,其判别能力优于其他模型。模型中最重要的五个特征被确定为体表面积、淋巴细胞计数、体重指数(BMI)、绝对中性粒细胞计数和化疗方案。值得注意的是,体表面积是预测结局的最重要影响因素。具体而言,较高的体表面积水平与CIN风险增加相关。紫杉醇+卡铂和紫杉醇+顺铂的化疗方案与CIN风险呈正相关。较低的淋巴细胞计数、BMI和绝对中性粒细胞计数提示较高的CIN风险。基于CatBoost模型的AI应用程序已部署在http://39.96.172.15/上。
结论:CatBoost模型在预测NSCLC患者CIN风险方面表现出较强的判别能力。所开发的AI模型可作为增强临床决策的有价值工具。
论文解读文章
研究背景与问题
化疗是非小细胞肺癌(NSCLC)多学科治疗的基石,但化疗所致中性粒细胞减少症(CIN)是其常见且临床意义重大的血液学并发症。严重(3/4级)中性粒细胞减少可增加感染、脓毒症、住院及化疗中断或减量的风险。尽管预防性使用粒细胞集落刺激因子(G-CSF)可降低风险,但由于风险分层工具不完善,其应用并不一致。现有预测模型多基于逻辑回归或Cox比例风险模型,其AUC约为0.65-0.75,预测效能中等,无法满足精准医学需求。少数研究整合药代动力学/药效学参数,但模型构建复杂、临床通用性差。近年来,机器学习模型在临床预测中展现出潜力,但专门针对NSCLC队列的高性能模型罕见,且多数未被开发为易用的网络应用程序,限制了研究成果向临床实践的转化。模型可解释性亦是推广应用面临的挑战。因此,本研究旨在开发一个基于人工智能(AI)的网络应用程序,利用先进机器学习算法为接受骨髓抑制化疗的NSCLC患者提供个体化的严重CIN风险预测,以指导G-CSF的合理预防性使用,优化化疗管理。该论文发表在《Cancer Medicine》。
主要技术方法
研究人员在天津医科大学总医院开展前瞻性观察研究,纳入2019年至2024年间310名NSCLC患者(共1047个化疗周期)。采用Boruta算法进行特征筛选,使用5折交叉验证及Optuna框架对6种机器学习模型(深度森林、CatBoost、神经网络、决策树、随机森林、支持向量机)进行超参数优化(HPO),并构建堆叠集成模型。模型评估采用AUC、准确率、召回率、特异度、F1分数和Brier分数,并绘制决策曲线分析(DCA)。模型解释采用Shapley加法解释(SHAP)、局部可解释模型无关解释(LIME)和部分依赖图(PDP)。基于最优模型,利用Streamlit平台开发在线AI应用程序。
研究结果
1. Clinical Characteristics(临床特征):
共纳入310名患者(中位年龄65.00岁,74.84%为男性),250个(23.88%)化疗周期发生≥3级CIN。化疗方案以紫杉醇(PTX)+卡铂(CBP)为基础(43.65%)和培美曲塞(Pem)+CBP为基础(32.76%)为主。通过患者特征分析,研究人员获得了研究人群的基础数据分布。
2. Feature Selection(特征筛选):
采用Boruta算法筛选出11个重要特征:年龄、化疗方案、化疗重复周期数、淋巴细胞计数、肾小球滤过率、白细胞计数、体表面积、BMI、绝对中性粒细胞计数、血浆胆红素和丙氨酸氨基转移酶。这些特征作为后续预测模型的输入变量。
3. Model Construction and Performance(模型构建与性能):
经HPO后,CatBoost模型在测试集上表现最佳:AUC为0.849(95% CI: 0.788-0.905),准确率0.813,召回率0.814,特异度0.813,F1分数0.642,Brier分数0.141。堆叠模型AUC最高(0.854),但准确率和特异度较低。综合考虑判别能力与模型稳定性,研究人员选择CatBoost作为最终预测模型。敏感性分析(包括完整病例分析和仅首次化疗周期分析)结果与主分析一致,表明模型稳健。
4. Model Interpretation(模型解释):
SHAP分析显示,最重要的五个特征依次为:体表面积、淋巴细胞计数、BMI、绝对中性粒细胞计数和化疗方案。体表面积与CIN风险呈正相关,当体表面积>1.624 m2时风险增加。淋巴细胞计数<1.070×10?/L时CIN风险增加。BMI<25.344 kg/m2时风险较高,但BMI低于24.780 kg/m2后风险虽下降但仍高于较高BMI组。绝对中性粒细胞计数低于约4.410×10?/L时CIN风险增加。化疗方案中,紫杉醇+卡铂和紫杉醇+顺铂与CIN风险正相关。PDP和ICE图进一步展示了特征对预测结果的效应。
5. Online AI Prediction(在线AI预测):
基于CatBoost模型的AI应用程序部署于http://39.96.172.15/,用户可免费访问。输入相关参数后,应用程序输出CIN风险概率,并以0.348为阈值定义高风险个体(可能受益于预防性G-CSF)。同时生成详细风险报告,列出关键风险/保护因素及其相对重要性。
总结讨论与结论
讨论部分指出:准确预测CIN具有重要临床意义,可指导高风险患者提前预防、低风险患者避免过度干预。本研究通过Boruta算法筛选特征,构建了高效精简的机器学习模型。体表面积是最重要的预测因子,其与CIN风险的正相关可能与化疗剂量计算中的药代动力学效应有关。淋巴细胞计数、BMI、绝对中性粒细胞计数和化疗方案均为CIN的显著预测因素。与既往研究不同,本研究中体表面积与CIN风险呈正相关,而BMI呈负相关。化疗方案中紫杉醇+卡铂/顺铂风险较高。CatBoost模型在平衡判别能力、实用性和可解释性方面优于其他模型。通过整合SHAP、LIME和PDP多种解释方法,增强了模型透明度。在线AI应用程序的部署降低了临床采用门槛。研究局限包括单中心设计、基于中国患者数据(需在不同人群中验证)以及未纳入新型生物标志物。
结论部分翻译:总之,本研究开发的人工智能网络应用程序为预测NSCLC患者的CIN提供了一种新的有效工具。尽管存在局限性,但它为未来的临床实践和研究奠定了基础。随着技术的不断进步和深入研究的开展,该模型有望在临床环境中发挥更大作用,为NSCLC患者的化疗管理提供更强有力的支持。