
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习与传统统计模型在预测癌症患者口服酪氨酸激酶抑制剂相关QTc延长风险中的比较研究
【字体: 大 中 小 】 时间:2025年08月16日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
本研究针对癌症患者接受靶向治疗时QTc延长风险预测的临床需求,中国医科大学附属医院团队通过回顾性队列研究,比较了逻辑回归(LR)与7种机器学习(ML)算法对400例使用VEGFis/BCR-ABLis患者的预测效能。研究发现包含基线QTc延长、心血管疾病等12个参数的统计模型(AUROC=0.89)优于ML模型,风险概率截断值0.46可有效识别高风险患者,为临床决策支持系统(CDSS)开发提供重要依据。
在癌症治疗领域,靶向药物如酪氨酸激酶抑制剂(TKIs)虽然显著提高了疗效,但伴随的心血管毒性尤其是QT间期延长(QTc prolongation)成为临床棘手问题。据统计,约42%接受TKIs治疗的患者会出现QTc延长,其中5%可能发展为致命性心律失常如尖端扭转型室速(TdP)。更令人担忧的是,随着癌症患者生存期延长,心血管疾病(CV)相关死亡率已超过癌症本身,占比高达22%。面对这一严峻现状,如何精准预测QTc延长风险、平衡治疗获益与心血管风险,成为肿瘤心脏病学领域亟待解决的关键问题。
中国医科大学附属医院的研究团队开展了一项开创性研究,通过分析2016-2020年间400例接受五种常用口服TKIs(包括VEGFis如索拉非尼和BCR-ABLis如伊马替尼)的癌症患者电子病历(EMR)数据,首次系统比较了传统统计方法与机器学习在QTc延长风险预测中的效能。这项发表在《BMC Medical Informatics and Decision Making》的研究,为靶向治疗时代的心血管风险管理提供了重要决策工具。
研究采用四步法技术路线:首先通过多重插补处理缺失数据;随后运用单变量逻辑回归和机器学习特征选择方法筛选重要变量;接着采用反向逐步回归和7种ML算法(包括ANN、RF、GB等)构建预测模型;最后通过ROC曲线确定风险概率截断值。研究特别关注基线心电图参数、共病状态和实验室指标等55个潜在预测因子,QTc延长定义为男性≥450 ms/女性≥470 ms(Bazett公式)。
研究结果呈现三大重要发现:
模型比较:统计方法筛选的12参数模型(含基线QTc延长、其他CV疾病、总胆红素>2 mg/dL等)展现出最佳预测性能,训练集AUROC达0.89,测试集灵敏度0.91、特异度0.75,显著优于ML模型(最佳ML模型AUROC=0.86)。模型拟合指标(AIC=188.278,BIC=235.484)也证实其优越性。
风险概率:基线风险概率为0.115,当存在基线QTc延长时风险概率增加0.471(贡献最大),其次是其他CV疾病(增加0.282)。风险概率截断值0.463能有效区分高低风险组,对应AUROC=0.784。
临床意义:该模型特别适用于肝癌高发的亚洲人群(本研究81%为HCC患者),且对非HCC患者同样有效。研究强调基线心电图筛查的不可或缺性,并为EMR系统集成和可穿戴设备开发提供算法基础。
在讨论部分,作者Hsiang-Wen Lin等指出,这是首个针对口服TKIs的QTc延长风险预测模型,其优势在于:①采用临床易获取的常规参数;②解决既往模型对癌症患者特异性不足的问题;③验证了统计方法在医学预测模型中的持续价值。研究局限性包括单中心回顾性设计、样本量限制以及未纳入新型TKIs等。未来需前瞻性验证并扩展至其他靶向药物。
这项研究为癌症治疗的心血管风险管理树立了新标准,其开发的预测工具可帮助临床医生在处方TKIs前精准识别高风险患者,通过加强监测和早期干预,最终实现肿瘤治疗"心"安全的终极目标。随着数字医疗发展,该模型有望整合入临床决策支持系统(CDSS),推动肿瘤心脏病学的精准化实践。
生物通微信公众号
知名企业招聘