编辑推荐:
为解决临终关怀患者缺乏实验室指标测量导致生存预测困难的问题,研究人员开展了构建无实验室检测生存预测模型的研究。他们利用 LASSO 技术,构建列线图和网络计算器预测患者 30、45、60 天生存率,该模型准确性达 73%-75%,有助于临床决策。
在全球范围内,癌症已成为头号致死疾病。据世界卫生组织 2020 年全球癌症报告显示,中国在 2020 年的新增癌症病例占全球的 23.7%,癌症相关死亡更是占到了全球的 30.2%。近年来,中国恶性肿瘤死亡占总死亡的比例高达 23.91%,且发病率和死亡率还在持续上升。对于临终关怀的癌症患者来说,预测生存时间至关重要,它能帮助临床医生、患者及其家属在姑息治疗、营养支持等方面做出合理决策。然而,现有的生存预测模型大多依赖实验室参数,而临终关怀患者往往缺乏这些测量指标,这使得准确预测他们的生存时间变得极为困难。同时,临床医生对患者生存时间的预测(Clinician Prediction of Survival,CPS)常常不准确,影响医患沟通质量,甚至可能导致过度积极的临终关怀。
为了解决这些问题,汕头大学医学院第一附属医院的研究人员开展了一项极具意义的研究。他们旨在构建一个无需实验室检测的预测模型,精准预测临终关怀患者在 30 天、45 天和 60 天的生存率,并开发了在线版本以推广应用。这项研究成果发表在《BMC Public Health》杂志上。
研究人员开展此项研究主要运用了以下几个关键技术方法:首先,从汕头大学医学院第一附属医院临终关怀科选取 2008 年 1 月至 2018 年 12 月期间的癌症患者作为样本队列,这些患者预计生存期均小于 6 个月 。然后,收集患者的基线数据和癌症相关数据,涵盖多个方面。接着,运用 R 语言及相关软件包,采用 LASSO(Least Absolute Shrinkage and Selection Operator)算法进行特征选择,构建 Cox 比例风险回归模型,进而建立列线图(nomogram)。最后,通过校准曲线(calibration curve)、受试者工作特征曲线下面积(Area Under the Curve,AUC)和决策曲线分析(Decision Curve Analysis,DCA)等方法评估模型性能。
下面来看具体的研究结果:
- 基线临床特征:研究共纳入 4229 名患者,随机分为训练集(3163 人)和测试集(1066 人)。患者的中位生存时间为 44 天,中位年龄 61 岁。肺癌、肝癌和结直肠癌是最常见的癌症类型。男性患者占比 64%,多数患者来自城市且接受过初等及以上教育,但仅有 45% 的患者对自身疾病有全面了解。大部分患者存在肿瘤转移,且多数接受过镇痛治疗,但部分患者疼痛缓解效果不佳。
- 特征选择和列线图构建:运用 LASSO 算法,确定了 8 个预测因素,分别是生活质量(Quality of Life,QOL)、Karnofsky 表现评分(Karnofsky Performance Scale,KPS)、性别、疼痛持续时间、是否存在厌食、腹胀、呼吸急促和水肿。通过 Cox 比例风险回归模型分析,发现这 8 个变量均为生存天数的独立预测因子,其中 KPS 是最具保护作用的因素,而水肿则是对生存天数影响最显著的风险因素 。基于此,构建了列线图,医生可通过计算各指标得分并求和,对照列线图确定患者的生存概率。
- 列线图的验证和性能评估:以 30 天、45 天和 60 天为时间点进行评估,测试集的 AUC 值分别为 0.7538、0.7342 和 0.7324 ,表明模型性能良好。校准曲线显示模型在这三个时间点校准度良好,决策曲线分析结果表明,在训练集和测试集中,该模型在广泛的阈值范围内都具有显著的临床净获益。
- 列线图的网站:研究人员开发了免费且易用的在线列线图计算器(https://lulingzero.shinyapps.io/SHHCP-NOMO/ ),方便患者和医生计算 30 天、45 天和 60 天的生存概率。
在研究结论和讨论部分,研究人员构建的基于 LASSO Cox 回归模型的列线图及在线版本,为晚期癌症临终关怀患者的生存预测提供了新工具。与以往模型不同,该模型无需实验室参数,评估周期为每月,且利用 LASSO 算法有效避免了多重共线性和过拟合问题。虽然研究存在一定局限性,如回顾性数据库可能引入回忆偏倚和数据缺口、数据来自单中心且需外部验证等,但考虑到临终关怀的重点和患者经济状况,该模型仍具有重要的临床实用价值。它能够帮助临床医生和患者做出更明智的决策,对提升患者生活质量、减轻经济和心理负担意义重大。