预测非小细胞肺癌患者化疗所致中性粒细胞减少症的人工智能网络应用程序的开发：一项前瞻性研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Cancer Medicine》：Development of an Artificial Intelligence Web Application for Predicting Chemotherapy-Induced Neutropenia in Patients With Non-Small Cell Lung Cancer: A Prospective Study

【字体：大中小】 时间：2026年06月14日 来源：Cancer Medicine 3.1

编辑推荐：

　　摘要目的：本研究旨在开发一个用于预测非小细胞肺癌（NSCLC）患者化疗所致中性粒细胞减少症（CIN）的人工智能（AI）网络应用程序。方法：研究人员开展了一项前瞻性研究，纳入了2019年至2024年间来自天津医科大学总医院的310名NSCLC患者，这

摘要
目的：本研究旨在开发一个用于预测非小细胞肺癌（NSCLC）患者化疗所致中性粒细胞减少症（CIN）的人工智能（AI）网络应用程序。
方法：研究人员开展了一项前瞻性研究，纳入了2019年至2024年间来自天津医科大学总医院的310名NSCLC患者，这些患者共接受了1047个化疗周期。收集了详细的临床信息和实验室数据。数据集在患者层面被随机分为训练集（80%）和测试集（20%）。采用机器学习方法构建模型。在训练集上通过交叉验证完成训练和超参数优化（HPO）后，通过测试集比较模型性能。同时，通过整合上述优化的基学习器，构建了一个堆叠集成模型。使用标准评估指标，如受试者工作特征曲线下面积（AUC）、准确率、召回率、精确率、F1分数和Brier分数，进行模型判别。为增强最优模型的透明度，研究人员将Shapley加法解释（SHAP）与局部可解释模型无关解释（LIME）及部分依赖图（PDP）技术结合使用。基于最佳的机器学习模型，在互联网上开发了一个AI应用程序。
结果：分类提升（CatBoost）模型的AUC为0.849（95% CI：0.788-0.905），准确率为0.813，召回率为0.814，特异度为0.813，F1分数为0.642，Brier分数为0.141，其判别能力优于其他模型。模型中最重要的五个特征被确定为体表面积、淋巴细胞计数、体重指数（BMI）、绝对中性粒细胞计数和化疗方案。值得注意的是，体表面积是预测结局的最重要影响因素。具体而言，较高的体表面积水平与CIN风险增加相关。紫杉醇+卡铂和紫杉醇+顺铂的化疗方案与CIN风险呈正相关。较低的淋巴细胞计数、BMI和绝对中性粒细胞计数提示较高的CIN风险。基于CatBoost模型的AI应用程序已部署在http://39.96.172.15/上。
结论：CatBoost模型在预测NSCLC患者CIN风险方面表现出较强的判别能力。所开发的AI模型可作为增强临床决策的有价值工具。

论文解读文章

研究背景与问题
化疗是非小细胞肺癌（NSCLC）多学科治疗的基石，但化疗所致中性粒细胞减少症（CIN）是其常见且临床意义重大的血液学并发症。严重（3/4级）中性粒细胞减少可增加感染、脓毒症、住院及化疗中断或减量的风险。尽管预防性使用粒细胞集落刺激因子（G-CSF）可降低风险，但由于风险分层工具不完善，其应用并不一致。现有预测模型多基于逻辑回归或Cox比例风险模型，其AUC约为0.65-0.75，预测效能中等，无法满足精准医学需求。少数研究整合药代动力学/药效学参数，但模型构建复杂、临床通用性差。近年来，机器学习模型在临床预测中展现出潜力，但专门针对NSCLC队列的高性能模型罕见，且多数未被开发为易用的网络应用程序，限制了研究成果向临床实践的转化。模型可解释性亦是推广应用面临的挑战。因此，本研究旨在开发一个基于人工智能（AI）的网络应用程序，利用先进机器学习算法为接受骨髓抑制化疗的NSCLC患者提供个体化的严重CIN风险预测，以指导G-CSF的合理预防性使用，优化化疗管理。该论文发表在《Cancer Medicine》。

主要技术方法
研究人员在天津医科大学总医院开展前瞻性观察研究，纳入2019年至2024年间310名NSCLC患者（共1047个化疗周期）。采用Boruta算法进行特征筛选，使用5折交叉验证及Optuna框架对6种机器学习模型（深度森林、CatBoost、神经网络、决策树、随机森林、支持向量机）进行超参数优化（HPO），并构建堆叠集成模型。模型评估采用AUC、准确率、召回率、特异度、F1分数和Brier分数，并绘制决策曲线分析（DCA）。模型解释采用Shapley加法解释（SHAP）、局部可解释模型无关解释（LIME）和部分依赖图（PDP）。基于最优模型，利用Streamlit平台开发在线AI应用程序。

研究结果
1. Clinical Characteristics（临床特征）：
共纳入310名患者（中位年龄65.00岁，74.84%为男性），250个（23.88%）化疗周期发生≥3级CIN。化疗方案以紫杉醇（PTX）+卡铂（CBP）为基础（43.65%）和培美曲塞（Pem）+CBP为基础（32.76%）为主。通过患者特征分析，研究人员获得了研究人群的基础数据分布。

2. Feature Selection（特征筛选）：
采用Boruta算法筛选出11个重要特征：年龄、化疗方案、化疗重复周期数、淋巴细胞计数、肾小球滤过率、白细胞计数、体表面积、BMI、绝对中性粒细胞计数、血浆胆红素和丙氨酸氨基转移酶。这些特征作为后续预测模型的输入变量。

3. Model Construction and Performance（模型构建与性能）：
经HPO后，CatBoost模型在测试集上表现最佳：AUC为0.849（95% CI: 0.788-0.905），准确率0.813，召回率0.814，特异度0.813，F1分数0.642，Brier分数0.141。堆叠模型AUC最高（0.854），但准确率和特异度较低。综合考虑判别能力与模型稳定性，研究人员选择CatBoost作为最终预测模型。敏感性分析（包括完整病例分析和仅首次化疗周期分析）结果与主分析一致，表明模型稳健。

4. Model Interpretation（模型解释）：
SHAP分析显示，最重要的五个特征依次为：体表面积、淋巴细胞计数、BMI、绝对中性粒细胞计数和化疗方案。体表面积与CIN风险呈正相关，当体表面积>1.624 m2时风险增加。淋巴细胞计数<1.070×10?/L时CIN风险增加。BMI<25.344 kg/m2时风险较高，但BMI低于24.780 kg/m2后风险虽下降但仍高于较高BMI组。绝对中性粒细胞计数低于约4.410×10?/L时CIN风险增加。化疗方案中，紫杉醇+卡铂和紫杉醇+顺铂与CIN风险正相关。PDP和ICE图进一步展示了特征对预测结果的效应。

5. Online AI Prediction（在线AI预测）：
基于CatBoost模型的AI应用程序部署于http://39.96.172.15/，用户可免费访问。输入相关参数后，应用程序输出CIN风险概率，并以0.348为阈值定义高风险个体（可能受益于预防性G-CSF）。同时生成详细风险报告，列出关键风险/保护因素及其相对重要性。

总结讨论与结论
讨论部分指出：准确预测CIN具有重要临床意义，可指导高风险患者提前预防、低风险患者避免过度干预。本研究通过Boruta算法筛选特征，构建了高效精简的机器学习模型。体表面积是最重要的预测因子，其与CIN风险的正相关可能与化疗剂量计算中的药代动力学效应有关。淋巴细胞计数、BMI、绝对中性粒细胞计数和化疗方案均为CIN的显著预测因素。与既往研究不同，本研究中体表面积与CIN风险呈正相关，而BMI呈负相关。化疗方案中紫杉醇+卡铂/顺铂风险较高。CatBoost模型在平衡判别能力、实用性和可解释性方面优于其他模型。通过整合SHAP、LIME和PDP多种解释方法，增强了模型透明度。在线AI应用程序的部署降低了临床采用门槛。研究局限包括单中心设计、基于中国患者数据（需在不同人群中验证）以及未纳入新型生物标志物。

结论部分翻译：总之，本研究开发的人工智能网络应用程序为预测NSCLC患者的CIN提供了一种新的有效工具。尽管存在局限性，但它为未来的临床实践和研究奠定了基础。随着技术的不断进步和深入研究的开展，该模型有望在临床环境中发挥更大作用，为NSCLC患者的化疗管理提供更强有力的支持。

联系信箱：

粤ICP备09063491号

热点排行