编辑推荐:
为解决乳腺癌复发预测工具缺乏的问题,研究人员基于沙特阿拉伯 408 例患者数据,开展复发预测模型研究。通过多变量惩罚逻辑回归和 Cox 回归,发现化疗、手术等影响复发,模型 AUC 达 76%,C-index 超 0.8,为临床决策提供新工具。
乳腺癌作为全球女性最常见的恶性肿瘤,其复发转移一直是临床治疗的难题。在沙特阿拉伯,受文化、遗传及医疗条件等因素影响,乳腺癌患者的复发管理面临独特挑战。目前,临床缺乏针对该地区人群的精准复发预测工具,传统模型难以充分考虑地域特异性因素,导致治疗方案制定和预后评估存在局限性。因此,开发适用于沙特阿拉伯乳腺癌患者的复发预测模型,对提升个性化诊疗水平、改善患者预后具有重要意义。
来自沙特阿拉伯法赫德国王石油与矿产大学(King Fahd University of Petroleum and Minerals)等机构的研究人员,对达曼法赫德国王专科医院(King Fahd Specialist Hospital in Dammam)2002 年 7 月至 2021 年 11 月期间收治的 408 例乳腺癌患者数据展开分析,旨在构建基于本地人群的乳腺癌复发预测模型。研究成果发表于《Scientific Reports》。
研究采用回顾性队列研究设计,将患者分为训练集(n=285)和测试集(n=123)。主要技术方法包括:多变量惩罚逻辑回归(结合嵌套交叉验证和特征选择)用于构建分类模型,评估各因素对复发的预测价值;多变量 Cox 回归分析用于探索时间依赖性风险因素,计算风险比(HR);通过受试者工作特征曲线下面积(AUC-ROC)、精确召回曲线下面积(AUC-PRC)和 C-index 评估模型性能。数据预处理涉及标准化连续变量,采用卡方检验、Fisher 确切检验和 Mann-Whitney U 检验比较组间差异。
患者基线特征与单因素分析
训练集 285 例患者中,复发组 62 例,非复发组 223 例。复发组肿瘤大小(TS)中位数(35 mm)显著大于非复发组(29 mm,p=0.018)。手术和化疗在非复发组应用比例更高(手术 100% vs 90.3%,化疗 72.2% vs 35.5%,均 p<0.001),而年龄、淋巴结(LN)受累、绝经状态(MS)等因素组间无显著差异。
多变量逻辑回归模型性能
模型在训练集和测试集的 AUC-ROC 均为 76%(95% CI:72–81%,66–87%),AUC-PRC 均为 0.61,显示对不平衡数据的处理能力。关键预测因子包括肿瘤大小、手术和化疗:化疗使复发 odds 降低 86%(调整优势比 [AOR]=0.143,p<0.0001),手术降低 99%(AOR=0.009,p<0.0001),肿瘤大小每增加单位使复发 odds 增加 48.5%(AOR=1.485,p=0.0043),年龄无显著影响(AOR=0.841,p=0.1398)。
Cox 回归模型分析
初始模型显示,年龄每增加 1 岁使复发风险降低 3%(HR=0.97,p=0.043),肿瘤大小每增加 1 单位风险增加 1%(HR=1.01,p=0.027),原位癌(HR=0.05,p=0.013)和局部癌(HR=0.22,p=0.012)风险显著低于远处转移癌。手术和化疗分别降低 80%(HR=0.20,p=0.004)和 95%(HR=0.05,p<0.001)复发风险,而激素治疗(HT)显著增加风险(HR=10.01,p<0.001)。经特征筛选后,模型 C-index 在训练集和测试集分别为 0.81(95% CI:0.73–0.84)和 0.84(0.76–0.89),验证了模型的判别能力。
研究结论与意义
本研究开发的乳腺癌复发预测模型整合了肿瘤大小、手术、化疗等临床可获取变量,在沙特阿拉伯人群中展现出良好的预测效能。模型通过交互式应用程序(
https://iv3p9h-nurudeen-adegoke.shinyapps.io/breast_cancer)实现临床转化,可辅助医生基于个体复发风险制定治疗策略和随访计划,推动个性化医疗发展。研究首次针对沙特阿拉伯东部地区人群构建模型,填补了地域特异性研究空白,为资源有限地区的乳腺癌管理提供了可借鉴的工具。尽管存在样本量较小、未纳入基因病理特征等局限,但其为后续整合多维度数据优化模型奠定了基础,对全球乳腺癌精准医疗具有重要参考价值。